קורפוס .vs אינפורמנטים
28 במרץ, 2005

כשמתארים שפה, או עורכים מחקר כלשהו על שפה או שפות, יש צורך לקבל ממקום כלשהו את העובדות על השפה, בצורה הגולמית שלהן, לפני העיבוד בכלים מדעיים והמחקר המעמיק. ישנם שני מקורות מהם אפשר להשיג עובדות לשוניות: קורפוס (רצף נתון של פארול*) או תחקור של אינפורמנטים (דוברים ילידיים של השפה).
בפוסט הזה, שהתחיל מדואל שכתבתי, אציג את החסרונות של השימוש באינפורמנטים, ואת היתרון שבשימוש בקורפוס אל מול החסרונות האלה. הטקסט הוא פולמוסי במידת־מה: אל תצפו לאיזון. אשמח לשמוע דעות מנוגדות.

* ר' דה סוסיר.



תחילה, אתאר את שני מקורות המידע השונים לעובדות לשוניות:

לענייננו חשוב להבחין בכך שבמקרה שבלשן מקליט אינפורמנט מספר סיפור, נאמר, באופן טבעי, כפי שהיה מספר אותו לבני החברה שלו, הרי שהחומר איתו הבלשן יעבוד הוא "קורפוס", שכן מדובר ברצף לשוני נתון שלא מכוון או מופרע על־ידי הבלשן: ההבדל בין קורפוס ממקור כזה (בלשן, או שלוחו, שמקליט דוברים ילידיים) לבין קורפוס אותו הדובר הילידי יוצר מטעם עצמו (ספר שכתב, סיפור שהקליט, וכו') הוא באמצעי בלבד, ואינו עקרוני יותר מדי.

ישנן כמה בעיות עיקריות שאני מוצא בקבלת עובדות לשוניות בשיטה של תחקור אינפורמנטים. אני לא מתיימר לחשוב שאני הראשון שחושב על הבעיות האלה. אלו הן, ללא יחס־סדר עקרוני ביניהן:

אלו בעיות שקיימות במחקר לשוני שמתבסס על תשאול של אינפורמנטים. כמובן שלשימוש בקורפוס יש את החסרונות שלו, אבל עדיין, לעניות דעתי, הוא המקור העדיף, אם לא היחיד, לאיסוף של עובדות לשוניות. הוא זה שממנו אפשר באמת להפיק משהו שניתן להסתכל עליו באופן רציני מנקודת מבט מדעית. שימוש באינפורמנטים, כמו שראינו, הוא כלי מסוכן, ששימוש בו יכול להביא לתוצאות עקומות ובלתי־מדעיות.

אם להשתמש בקריטריון ההדירות לתיאוריה מדעית (היכולת לחזור על "ניסוי" ולקבל תוצאות זהות, או דומות מספיק, שמאששות את התיאוריה), הרי שהקורפוס עומד בו והשימוש באינפורמנטים לא. בהנתן קורפוס, שאף אחד לא יכחיש שהוא ביטוי אמיתי לחלוטין של לאנג, ממקור אידיולקטלי, תמיד אפשר לבדוק תיאוריות על השפה אל מול הקורפוס. מצד שני, אחרי ששאלתם שאלות את האינפורמנט, לעולם לא יהיה ניתן לחזור שוב על אותו התהליך: בין אם בגלל שהאדם הנשאל אינו זמין יותר, ובין אם בגלל שעצם התחקור השפיע עליו. כשמקבלים תוצאות של מחקר בלשני שמקורו בתשאול אינפורמנט, אין לנו אלא להאמין לבלשן, וזהו - אי אפשר לעשות שום דבר נוסף, ודאי שלא לחזור על ה"ניסוי".
גם קריטריון ההפרכה לתיאורה מדעית (כדי שתיאוריה תחשב כמדעית, עליה להיות, ברמה התיאורטית, ניתנת להפרכה) עובד לטובת השימוש בקורפוס. נתון קורפוס מסויים: אפשר להפריך את דרכי ההיסק של הבלשן או להביא ראיות מקורפוס לכך שמה שהוא מסיק שגוי. כשמקבלים תשובה של אינפורמנט, אין מה לעשות מולה: חזקה עלינו לקבל את הדברים שלו כמות שהם, בלי יכולת לערער עליהם או להתבונן בהם לעומק.

כמובן שהבעיה קריטית אפילו יותר כשהבלשן משתמש בעצמו כאינפורמנט, אפילו הוא דובר ילידי של השפה. הכל נעשה מוטה ועקום כך.

באופן כללי, השימוש בקורפוס לא לוקה באותם חסרונות שהוזכרו כאן, לפחות לא באותה מידה שקיימת בשימוש באינפורמנטים. כמובן שאסור לקורפוס להווצר על־ידי הבלשן (אדם לא יכול לעשות עבודה מחקרית רצינית על פארול שהוא מייצר). אני משאיר לקורא לראות לבד איך בשימוש בקורפוס הבעיות האלו מתגמדות, או פשוט לא קיימות - זה טריוויאלי.

(נהגה ונכתב בשעה ומשהו של להט־כתיבה...)

תגים