|
|
טקסטים גליסים |
הטכניקה היחידה ללמוד שפה כתובה היא לקרוא. הרבה. זה נותן מגע בלתי־אמצעי עם מבנים לשוניים "בסביבתם הטבעית": לא מפורקים באנליזה של מחבר דקדוק זה או אחר, שהיא, בהגדרה, מלאכותית.
אז אנחנו מסכימים שצריך לקרוא כדי ללמוד לקרוא. בהתחלה זה קשה, וצריך לשבור את הראש כדי להבין איך לפרק את הבליל שנמצא בטקסט ולהרכיב אותו מחדש בצורה קוהרנטית. בטח שפשוט לקחת ספר ולקרוא, ביחד עם מילון ובעזרה של ספר־דקדוק (משניהם צריך להיזהר, אבל בשניהם – במיוחד בראשון – אין ברירה אלא להשתמש, במיוחד בהתחלה), זה לא ממש קל. עד שמגיעים לסוף־המשפט, שוכחים מה קראנו בהתחלה. בטח שכשגומרים לקרוא את הטקסט, ורוצים לחזור עליו שוב, כדי להגיע להבנה מעמיקה יותר, לא ממש זוכרים מה אומרת כל לקסמה ואיזו צורה דקדוקית נמצאת בכל מקום.
בשביל זה בדיוק המציאו את הגלוסות. נסתכל על שורה בודדת של טקסט. אנחנו יכולים לשרבט מעליה ומתחתיה מידע שיעזור לנו לפענח/להזכר את המבנה של הטקסט, בין אם ברמה לקסיקאלית או "מורפולוגית" (נגיד, בלטינית נכתוב מעל amo משהו בסגנון של love: 1sg prae ind pos act 1conj אם נרצה לכתוב ברמת־פירוט גבוהה) או תחבירית, עם הסברים גראפיים או מילוליים על המבנים התחביריים (נגיד לסמן בחץ פוריות, הצבעה, שהיא לא טריוויאלית להבנה, או להצביע ולהגיד "הנה פרזננטיב" או "כאן יש אקזיסטאנט").
זה נוח שהטקסט המקורי בצבע אחד, נגיד שחור, הגלוסות הלקסיקאליות בצבע אחר והמידע הדקדוקי בצבע שלישי. אחרי שמכינים את הטקסט ובאים לשיעור, אפשר להוסיף הערות בשוליים בהתייחסות לטקסט, בצבע רביעי. ככה מקבלים דף צבעוני מאוד, שזה יפה.
זה גם נוח ככה לסמן דוגמאות כשעובדים על תיאור של תת־מערכת לשונית: אפשר להוסיף מימד נוסף, של מארקרים…
בקיצור, אחרי השיווק האגרסיבי הזה לשימוש בגלוסות (שזה, אגב, נוהג קדום יחסית: זה די נחמד לקרוא גלוסות ימיבינימיות), נגיע לעיקר בדף: טקסטים בשפות שונות שמסודרים ככה שיהיה קל לכתוב גלוסות על הדפים המודפסים.
טקסטים שמסומנים ב־COPYPASTE לא אני הקלדתי; אני לא ערב לדיוק שלהם.
כמובן שאשמח לשמוע תיקונים והערות. העתקתי את הטקסטים בדיוק כמו שהם, גם כשבמקור יש במפורש שגיאת־הקלדה (החל מנקודה מסויימת הכנסתי "sic"־ים). הטכניקה שבה העתקתי את הטקסט כרוכה בעבודה כפולה, אבל מוציאה פלט שסביר להניח שכמעט ולא מכיל שגיאות־ההעתקה שלי: הקלדתי את הטקסט פעמיים (או סרקתי והעברתי דרך OCR) והרצתי diff על שני הקבצים. אם מישהו רוצה לעזור לי בהקלדה/סריקה של טקסטים (נגיד שאני אקליד העתק אחד והוא את השני), דאלוני.
בקשה: אם אתם מדפיסים את הטקסט, תדפיסו אותו בבקשה על שני הצדדים של הדף (דופלקס), בשביל העצים. תודה :-)
קבצים שמסומנים כ־booklet מיועדים להדפסה דו-צדדית (על הצד הרחב) וקיפול של הדפים באופן כזה שתיווצר חוברת קטנה.
טוב, חסל קשקשת; הנה הטקסטים:
- Y Dathlu (Bwrw Hiraeth)
- AUTH — Dafydd Parri
- LNG — Cymraeg
- GL — PDF (booklet) / TeX
- ADD — 2008·6·7
- Frá dauða Sigurðar: Guðrúnarqviða in fyrsta
- LNG — Norrœnt mál
- GL — PDF (booklet)
- TEXT — TeX
- ADD — 2008·5·15
- John, ch. 5
- Oifig an Phoist, Dúil
- LNG — Gaeilge
- GL — PDF / TeX
- TEXT — PDF
- MNKZ — Anat 'dwmj, Boaz Janiv, Janiv Gabaj-Müller, Jehuda Ronen
- ADD — 2008/2/3
- The first chapter of the Old Testament
- LNG — Frysk, Afrikaans, Nederlands, Biblical Hebrew
- TEXT — PDF / TeX
- ADD — 2007/11/29
- Easy readings in Old Icelandic: with outlines of grammar and vocabularies
- AUTH — William Alexander Craigie
- LNG — Norrœnt mál
- GL — PDF / TeX
- TEXT — PDF
- ADD — 2007/10/27
- Dianc i Lundain, Te yn y Grug
- AUTH — Kate Roberts
- LNG — Cymraeg
- GL — PDF / TeX
- TEXT — PDF
- ADD — 2007/1/25
- Hilaria, from Three Coptic Legends (Hilaria, Archellites, The Seven Sleepers), edited by James Drescher
- LNG — Coptic (~Sahidic, with quotations of fragments in other dialects)
- GL — (to be added)
- TEXT — (to be added)
- ADD — 2007/1/21
- EXT — Without the beginning and the ending
- Pedeir Keinc y Mabinogi
- LNG — Cymraeg Canol
- GL — PDF: Pwyll Pendeuic Dyuet, Branwen uerch Lyr, Manawydan uab Llyr, Math uab Mathonwy; TeX
- TEXT — PDF: Pwyll Pendeuic Dyuet, Branwen uerch Lyr, Manawydan uab Llyr, Math uab Mathonwy
- ADD — 2007/1/15
- COPYPASTE
- Fearfeasa Mac Feasa: An Dearmad
- AUTH — Pádraic Ó Conaire
- LNG — Gaeilge
- GL — PDF / TeX
- TEXT — PDF
- ADD — 2007/1/15
- Fearfeasa Mac Feasa: Bróga Rúiseacha
- AUTH — Pádraic Ó Conaire
- LNG — Gaeilge
- GL — PDF / TeX
- ADD — 2006/12/27
- Περιπέτεια
- AUTH — Γιαννης Μαρης
- LNG — Νέα Ελληνικά
- GL — PDF / TeX
- TEXT — PDF
- ADD — 2006/12/1
- LAST — 2007/1/17
- EXT — 1st chapter
- Dychwelyd
- AUTH — Kate Roberts
- LNG — Cymraeg
- GL — PDF
- TEXT — PDF
- ADD — 2006/11/29
- Gofid, Te yn y Grug
- AUTH — Kate Roberts
- LNG — Cymraeg
- GL — PDF / TeX
- ADD — 2006/5/20
ספרים (ישלח אישית בדואל רק למי שקנה את הספר ומשתמש בו לעבודה בלשנית):
- Harri Potter a Maen yr Athronydd
- AUTH — J. K. Rowling
- LNG — Cymraeg
- Bwrw Hiraeth
- AUTH — Dafydd Parri
- LNG — Cymraeg
- Te yn y Grug
- AUTH — Kate Roberts
- LNG — Cymraeg
8 תגובות »
RSS feed לתגובות לפוסט הזה
TrackBack URI
כתיבת תגובה
תגי HTML מותרים:




תבורך. ניסיתי פעם לכתוב סקריפט קצר שלוקח טקסט מאתר אינטרנט ומסדר אותו לגלוסות באופן אוטומאטי. זה עבד עד שמת לי מחשב, הרם כפפה?
תגובה מאת ששון הספרייט — 2006年12月1日 @ 9:53
אם אתה משתמש ב־LaTeX, התבנית הבאה מסדרת טקסט עם ריווח גדול בין השורות ובין המילים. הטקסט עצמו נמצא בקובץ נפרד (texfilename בתבנית); כמובן שאפשר להחליף את ה־{input{textfilename\ בטקסט עצמו. היתרון בעריכה בקובץ נפרד זה זה שקל יחסית, במקרה שמקלידים ידנית טקסט, לכתוב אותו פעמיים בשני קבצים נפרדים ולעשות diff ביניהם. זה מבטל כמעט לחלוטין את הסיכוי לשגיאות־הקלדה: הסיכוי שתקליד את אותה השגיאה באותו המקום פעמיים קטן מאוד.
\usepackage{setspace, palatino}
\setlength\parskip{0.35in}
\setlength\parindent{0pt}
\setlength\spaceskip{0.7cm plus 0.1cm minus 0.1cm}
\renewcommand{\baselinestretch}{2.9}
\begin{document}
\input{texfilename}
\end{document}
תגובה מאת יהודה — 2006年12月1日 @ 15:27
ובעניין של אוטומאטיזאציה של התהליך (שהוא ארוך, מתיש ומונוטוני; אם כי מדיטטיבי…): עלה לי פעם רעיון, שמתישהו אממש אותו, לכתוב תוכנה שמקבלת input סרוק, מזהה איפה נמצא הגבול בין שורות (על־ידי כך שהיא סורקת, בה"כ, את הדף מלמעלה למטה, מסכמת את הכמות של הנקודות השחורות בכל שורה של פיקסלים ומחפשת נפילה/קפיצה משמעותית במספר שלהן: זה מצביע על הגבולות של שורות) ומרחיבה אותו באופן מלאכותי, על־ידי הוספה של שורות לבנות. זה אפילו לא אמור להיות היסטרי לתכנת את זה עם ספריה טובה לעיבוד־תמונה.
תגובה מאת יהודה — 2006年12月2日 @ 18:29
תרשה לי להמליץ על matlab או octave. זה נשמע כמו סקריפט של חמש שורות.
תגובה מאת דן — 2006年12月2日 @ 21:47
זה מזכיר נשכחות. אחד התענוגות הגדולים שלי במסגרת הלימודים בחוג היו לגלס טקסטים (כשהיה זמן), בעיקר בשפות עם מערכת כתב אידיאוגרמית, ולנסות להפיק משהו אסתטי ככל הניתן. עד היום נשארו לי גלוסות של המלח טרוף-הספינה ופתחותפ, כתובות בעט שחור (הירוגליפים), ירוק (תעתיק) וכתום (תרגום). ככה גם הצלחתי לשלב את החיבה למערכות כתב אידיאוגרמיות עם החיבה לכל מגוון עטי ה-0.4 של פיילוט…
תגובה מאת יעל — 2006年12月4日 @ 3:33
:-)
אם כי מעל 漢字 עט 0.25 מתבקש… אם מישהו תמה למה לכל־כך הרבה יפאנים יש משקפיים, שיסתכל על גודל־הפונט של ה־振り仮名.
תגובה מאת יהודה — 2006年12月4日 @ 23:50
יש משהו מאוד אסתטי בטקסט עם פוריגאנה ("מפורגן"? ובשם הפועל "לפרגן"?). טקסטים ביפאנית וסינית מצדיקים גם רכישה של עט ציפורן, כי התוצאה שמתקבלת נאה יותר. גם אם לא באמת יודעים קליגרפיה, אפשר "לפברק" סו-שו (http://ja.wikipedia.org/wiki/%E8%8D%89%E6%9B%B8%E4%BD%93) והתוצאה תצא מעניינת לעין – כל עוד מקפידים על סדר הקווים.
תגובה מאת יעל — 2006年12月5日 @ 0:35
אני לא כל כך מסכים לגבי ההנחה – שהדרך הטובה ביותר ללמוד שפה היא לקרוא הרבה בלי להעזר בדקדוקים או טקסטים שנכתבו במיוחד להוראת שפה. (כן, אני יודע שזה נוגד את האינדוקטרינציה של החוג לבלשנות באוני' העברית…)
למעשה, אני סבור שזו כנראה אחת הדרכים הגרועות ביותר מבחינת זמן, וכן גרועה למדי מבחינת היכולת לכתוב אחר כך בשפה הנתונה (אני מתעלם משאלת הדיבור, שכן מראש צמצמת את הדיון לשפה כתובה).
היתרון בשימוש בטקסטים שנועדו ללימוד, הוא שהלומד יכול להתמודד כל פעם עם פריט מידע נלמד חדש אחד, מה שמייעל כמובן את תהליך הלימוד, ובנוסף הופך אותו לשקוף יותר (ברור יותר מה התפקיד של הפריט החדש).
היתרון היחיד ששיטת קריאת הטקסטים מאפשרת אולי היא העובדה שהלומד בא "בראש פתוח" מבחינה בלשנית ולא מקבל אילושהן אמיתיות אפריורי על השפה. אבל אפילו זה לא נכון, כיוון שכמו שציינת, בכל מקרה אין מנוס אלא להעזר בספר דקדוק (וודאי למורפולוגיה, וגם לדגמים מסובכים). ובכל מקרה, אף אחד לא מגיע בראש פתוח כיוון שכל אחד מוטה לפי שפת האם שלו.
אבל ניתן בקלות להשיג את היתרון הזה גם בשיטה הפדגוגית אם נתחיל עם טקסטים מלאכותיים ואז כשנגיע לרמה מספקת נעבור לטקסטים "אמיתיים". אם יש לנו מספיק מעוף בלשני נוכל בשלב זה להתגבר על ה"ההטיות" לכאורה שהכניס בנו תהליך הלימוד.
תגובה מאת אריאל — 2007年1月30日 @ 15:58