מחקר

כלים

אנחנו מפתחים כמה כלים שישמשו אותנו בפרויקט.

הכלים האלה יסייעו במתן משוב למורים, מתן ציונים לתלמידים והפקת הנתונים הנדרשים כדי לענות על שאלות המחקר שלנו.

At three times during the baseline study and field tests (beginning, middle and end of the school year), students will complete a survey of science affect.
This survey is be based on an existing survey that has been validated for use with middle school students.

The survey measure self-efficacy for learning more science and using science ideas to make sense of new issues, motivation to learn more science, sense of agency related to GCs, interest in various science and socio-science topics, and interest in STEM professions.

To explore the potential impact of GC learning experiences on affect, we will first employ partial credit Rasch analysis to locate students’ self-efficacy, motivation, agency, and interest on separate metrics.

We will then compare survey results from students in the baseline study with those from the field tests at each time point. To better understand how student affect might change over time associated with GC learning, we will compare field test students’ survey responses across the three time points.

In considering learning of science content, our we take a multi-level assessment approach. Assessments can be considered at various distances from an intervention. A proximal assessment’s items and tasks are closely related to an intervention’s learning context. More distal assessments connect to an intervention in terms of relevant standards or general expectations but present items and tasks dissimilar from the learning context. Proximal measures are more sensitive to intervention effects; distal measures make it possible to compare results across different interventions and approaches. 

We will use three assessments of science knowledge: Curriculum-Aligned Assessments (CAAs) will be the most proximal measure, an Issue-Based Assessment (IBA) will provide an intermediately distanced measure, and student performance on TIMSS items will serve as the most distal measure.

A CAA is being developed for each GC unit and administered after that unit’s enactment. These assessments are being developed along with the units, are being tested during the pilots, and necessary revisions are being made prior to their use in the field tests. Each of the CAAs is accompanied by a scoring rubric. In order to monitor students’ learning, we will sample items from the individual CAAs to create a curriculum-aligned pretest and implement the pretest at the beginning of the school year. 

A CAA is being developed for each GC unit and administered after that unit’s enactment. These assessments are being developed along with the units, are being tested during the pilots, and necessary revisions are being made prior to their use in the field tests. Each of the CAAs is accompanied by a scoring rubric. In order to monitor students’ learning, we will sample items from the individual CAAs to create a curriculum-aligned pretest and implement the pretest at the beginning of the school year. 

By comparing student performance on these items between the pretest and post-unit CAAs using an estimate of fidelity as a covariate in the analytic model, we will be able to monitor student learning over time and analyze how the various GC contexts are associated with learning.

For the IBA, we are developing 6 tasks based on the format that was developed for the national middle school test in Israel. In contrast to traditional science assessments (including the CAA), IBAs involve more complex scenarios and present students with additional information beyond what they will have learned during instruction.
In this way, the items mirror real-world situations in which students must use what they know to interpret new information and to connect it to their existing knowledge for constructing explanations, asking questions, evaluating arguments, and making decisions.

Each of the IBA tasks is accompanied by scoring rubrics. The new tasks and rubrics will be tested in Year 1 pilots. Two IBA tasks will be given to students as class activities to familiarize them with the format. At the end of the year, each student will be randomly assigned two of the remaining tasks.

To better understand how students using GC materials perform on distal achievement tests relative to their peers nationally, we are making use of items and data from TIMSS science assessments. We have identified 6 TIMSS items assessing knowledge of science concepts addressed in the GC units (2 items per unit). 

These items will be administered at the end of the field tests. We will compare the scores on the TIMSS items with those obtained by the general US/Israeli student populations when the items were originally administered. This will allow us to explore how GC-oriented instruction supports learning in comparison national performance.

We anticipate the ways in which teachers enact the curriculum will be a significant mediator of student outcomes. Therefore, we will collect teacher enactment data in order to keep track of which learning opportunities students were afforded.
All participating teachers will complete instructional logs in which they self-report the completion of activities, engagement in practices, formative assessments, classroom discussions, and ways in which culturally relevant teaching principles were enacted.

We will interview a sub-set of students in the field test. This sample will be purposefully selected, based on results from the surveys, such that we include roughly equal numbers of students who demonstrate high affect, low affect, and significant changes in affect over the course of each field test. 

The interviews will focus on students’ experiences, interest, motivation, and agency when learning from a GC unit in comparison to learning from traditional curriculum.

We will conduct six classroom case studies (three in each country) during the second field test.
Primary data sources for the case studies will be video recordings of classroom enactments of at least two GC units, field notes from classroom observations, artifacts including student work samples, and teacher interviews. 

To analyze data for each case study, we will look across the data sources to inductively code for trends that reflect enactment affordances and barriers with particular attention to the ways in which assessments (both classroom and end-of-grade) are considered, discussed, and enacted. 

Following creation of individual case studies, we will conduct cross-case analyses to explore similarities and differences between teachers within the same national context and between the two different contexts.

מדדים רגשיים

התלמידים ימלאו סקר למדידת היחס שלהם למדע (science affect) בשלוש נקודות זמן במהלך מחקר הייחוס: בתחילת שנת הלימודים, באמצעה ובסופה. הסקר מבוסס על סקר קיים שקיבל תיקוף בקרב תלמידי חט"ב.
הסקר מודד מסוגלות לימודית בכל הנוגע למדעים ולשימוש בכלים מדעיים לפענוח סוגיות חדשות, מוטיבציה ללמידת מדעים, פעלנות (agency) בנוגע לא"ג, התעניינות במגוון נושאים במדעים מדויקים ובמדעי החברה והתעניינות במקצועות מדעיים וטכנולוגיים.

כדי לבחון את פוטנציאל ההשפעה של למידה מוכוונת-א"ג על היחס של התלמידים למדע, נבצע ניתוח רָאש לניקוד חלקי (partial credit Rasch analysis) ונכמת את המסוגלות הלימודית, את המוטיבציה, את הפעלנות ואת ההתעניינות של התלמידים במדדים נפרדים.
 

לאחר מכן נשווה את תוצאות הסקר של התלמידים במחקר הייחוס לתוצאות של התלמידים ממבחני השטח בכל נקודת זמן. כדי לבחון איך היחס של התלמידים למדעים עשוי להשתנות עם הזמן כתוצאה מלמידה מוכוונת-א"ג, נערוך השוואה בין תוצאות הסקרים שנערכו בתחילת השנה, באמצע השנה ובסוף השנה במהלך מבחני השטח.

מדדי ידע

בכל הנוגע ללמידת תוכן מדעי אנו נוקטים גישת הערכה רב-שלבית. אפשר לבצע הערכות בכמה מרחקים מההתערבות. הערכות שקרובות להתערבות (proximal) מכילות משימות ושאלות בעלות קשר הדוק להקשר הלימודי של ההתערבות. להערכות רחוקות יותר מההתערבות (distal) יהיו נגיעות עקיפות יותר להתערבות. השאלות והמשימות ייגעו בסטנדרטים הרלוונטיים ובציפיות הכלליות מההתערבות, אך תוכנן לא יהיה דומה להקשר הלימודי שלה. מדידות קרובות יותר להתערבות יהיו רגישות יותר להשפעות הישירות שלה, ואילו מדידות רחוקות יותר יאפשרו לנו להשוות בין תוצאותיהן של התערבויות וגישות שונות.
 

נשתמש בשלוש הערכות של ידע מדעי: ההערכות הקרובות ביותר להתערבות יהיו מותאמות ליחדות ההוראה (Curriculum-Aligned Assessments – CAAs). בטווח הבינוני תבוצע הערכה בגישת חקר מדעי-חברתי (Issue-Based Assessment – IBA), ואילו ההערכה הרחוקה ביותר מההתערבות תמדוד את ביצועי התלמידים באמצעות פריטים מבחני TIMSS.

הערכות מהסוג הראשון (CAA) כבר נמצאות בפיתוח. כל יחידה תלווה בהערכה שתבוצע בסיום ההוראה. פיתוח ההערכות מתבצע בד בבד עם פיתוח היחידות. יעילות ההערכות נבדקת בשלב הפיילוט, וההערכות מתעדכנות ומשתפרות בהתאם לתוצאותיו לפני ההתקדמות לשלב מבחן השטח. כל הערכת CAA מלווה בהנחיות וקריטריונים ברורים למתן ציונים. כדי לנטר את התקדמות התלמידים, נבחרות שאלות ומשימות מייצגות מכל הערכה ואנו יוצרים מהמדגם הזה מבחן מקדים שייערך בתחילת שנת הלימודים.

כדי להשוות את הישגי התלמידים במבחן המקדים להישגים בהערכות שיתבצעו לאחר הטמעת היחידות, נשתמש באומדן של נאמנות ההטמעה למקור (fidelity) בתור משתנה לוואי (covariate) במודל האנליטי. כך נוכל לעקוב אחר התקדמות התלמידים במהלך הפרויקט ולנתח את הָקשר בין הקשרי הא"ג השונים ללמידה.

ההערכה מהסוג השני (IBA) תורכב מ-6 משימות בפורמט שפותח עבור המיצ"ב במדעים בחטיבות ביניים בישראל. בניגוד להערכות המקובלות כיום במקצועות המדעים (כולל הערכות CAA), הערכות מבוססות פתרון-בעיות (IBA) מכילות תרחישים מורכבים יותר, והמידע הניתן לתלמידים במסגרתן חורג מהחומר שהועבר בשיעורים.
הערכות מסוג זה מדמות מצבים אמיתיים, הדורשים מהתלמידים להשתמש בידע שרכשו כדי לפרש מידע חדש ולקשר אותו לידע הקיים שלהם. התלמידים נדרשים לנסח הסברים, לשאול שאלות, להעריך את תוקפם של טיעונים ולקבל החלטות.

כל הערכת IBA מלווה בהנחיות וקריטריונים ברורים למתן ציונים. יעילות המשימות החדשות והקריטריונים למתן ציונים תיבדק בפיילוטים שייערכו בשנה הראשונה. כדי ללמוד להכיר את הפורמט, התלמידים יקבלו שתי משימות IBA כפעילויות כיתתיות. בסוף השנה כל תלמיד יקבל שתיים מהמשימות הנותרות. המשימות יוקצו באקראי.

כדי להבין טוב יותר את יכולת התלמידים ליישם את החומר הנלמד ביחידות הא"ג בהערכות הרחוקות ביותר מההתערבות, נשתמש בשאלות ובנתונים ממבחני TIMSS. מתוך שלל השאלות במבחני TIMSS, זיהינו 6 המודדות ידע על הרעיונות המדעיים הנלמדים ביחידות הא"ג (2 שאלות לכל יחידה).

השאלות האלה יינתנו לתלמידים בתום מבחני השטח. נשווה את הניקוד בשאלות ה-TIMSS לניקוד בקרב כלל האוכלוסייה בארץ/בארה"ב במועד המקורי שבו ניתנו השאלות. כך נוכל לבחון איך הוראה מוכוונת-א"ג תומכת בלמידה בהשוואה לביצועים הארציים.
 

ראיונות עם תלמידים

נראיין קבוצת תלמידים במסגרת מבחן השטח. המדגם ייבחר על סמך תוצאות הסקרים ויכלול מספר שווה (בערך) של תלמידים בעלי יחס חיובי למדעים (אָפקט גבוה), תלמידים בעלי יחס שלילי למדעים (אפקט נמוך) ותלמידים שהאפקט שלהם השתנה שינוי מובהק במהלך מבחן השטח.

הראיונות יתמקדו בחוויות של התלמידים, במידת ההתעניינות שלהם, במוטיבציה ובפעלנות במהלך למידת חומרי א"ג לעומת למידה בתוכנית הלימודים המקובלת.

יומני מורה

אנו מצפים שלאופן שבו המורים ילמדו את החומר בתוכנית הלימודים תהיה השפעה מובהקת על התוצאות הלימודיות. לכן, כדי לעקוב אחר הזדמנויות הלמידה שהתלמידים יקבלו, נקפיד לאסוף נתונים על ההטמעה של יחידות ההוראה.
כל המורים המשתתפים בפרויקט יתבקשו למלא יומני הוראה ולדווח על השלמת פעילויות, על מידת ההשתתפות בתרגול, על הערכות מעצבות, על דיונים כיתתיים ועל אופן הטמעתם של עקרונות פדגוגיים בעלי רלוונטיות תרבותית לכיתה.

תצפיות, תוצרי תלמידים, רשמים מהשטח וראיונות עם מורים

במהלך מבחן השטח השני נערוך שישה מקרי בוחן, שלושה בכל מדינה. מקורות המידע העיקריים למקרי הבוחן יהיו הקלטות וידאו של הטמעת שתי יחידות א"ג לפחות, רשמים כתובים מתצפיות בכיתות, תוצרי תלמידים (ובכלל זה דוגמאות מעבודות של תלמידים) וראיונות עם מורים.

כדי לנתח את הנתונים בכל מקרה בוחן, נסקור את כל מקורות הנתונים ונקודד קידוד אינדוקטיבי של מגמות המשקפות את החסמים וההזדמנויות בהטמעת היחידות, בדגש על הדיונים בהערכות, על החשיבה עליהן ועל הטמעתן (הן ההערכות שיבוצעו בכיתה והן הערכות הציון הסופי).

לאחר שניצור את מקרי הבוחן, נערוך ניתוחים חוצי-מקרים (cross-case analyses) כדי לבחון את הדמיון ואת השוני בין מורים בהקשר טבעי זהה ובשנים הקשרים שונים.