Deinterlacing

ההיסטוריה של DEINTERLACING והשיטות הנפוצות לביצועה כיום.


לפני שנים נוצר התקן עבור וידאוrn
INTERLACED
, תקן אשר התאים בימיו הטובים למסכי ה-CRT הותיקים שהיו קיימים אז. היום, לאחר שיפורים טכנולוגים משמעותיים, התקנים הטובים של פעם גורמים למרבית הצרות של היום.rn


כיום, מרבית שיטות התצוגה (כולל מסכי ומקרני CRT) מסוגלים לטפל באות rn
PROGRESSIVErn
. אותות אלו משמעותית יותר נעימים לצפיה וקרובים לחויית הצפיה הקולנועית שכולנו כה נהנים ממנה.rn


הבעיה היא שגם כאשר הוחלט על תקני DVD, עדיין לא האמינו שבפורמט תמונה פרוגרסיבי טמונה הבטחה לאיכות תמונה משופרת. ולכן, גם פורמט DVD, וכן כל פורמטי הטלויזיה הסטנדרטים (SDTV), עדיין עובדים בפורמטים INTERLACED. לא די בכך, אלא שגם פורמטים מתקדמים יותר של HDTV מתבססים כפורמטים INTERLACED (ובמיוחד 1080i בקצבי 50 ו- 60HZ).rn


המטרה כיום, במיוחד במסכים שהם PROGRESSIVE בדרך שהם מציגים את התמונה (בכך כלולים מסכי פלאזמה, LCD, ומקרני DLP, LCD ו- LCOS), היא להציג את התמונה הטובה ביותר – וזו תמונה פרוגרסיבית. המעבר בין מקור INTERLACED ל- PROGRESSIVE אינו מעבר קל. הוא כרוך בשלבים שונים ובטכניקות שונות, עליהם אדבר כאן.rn




המקורrn




תוכן המקור הוא אחד הנושאים החשובים ביותר בתחום ה-DEINTERLACING. חשוב מאוד להבין את משמעויות כל סוג מקור ולהבין כיצד הוא נוצר. בגדול, ישנם כיום שלושה סוגי מקורות:rnrn

  • סרט קולנוע
  • מקור וידאו
  • מחשב


לכל אחד מהמקורות הנ"ל יש את הבעיות והיתרונות שלו.rn




מקור קולנועיrn




בתהליך ההמרה של סרט קולנוע לוידאו, אשר מוכר בשם:rn
telecinern

יש צורך בהמרה של קצב הפריימים מ- 24 פריימים בשניה (קצב זה הינו קבוע בתעשית הקולנוע, כל פריים מוצג פעמיים לצופה בשיטה הנקראת DOUBLE SHUTTER אשר מדמה לצופה 48FPS) לזו של הוידאו. במקרה של NTSC, מדובר ב- 60 FIELDS לשניה (במדויק יותר, זה 59.94HZ). במקרה של PAL מדובר ב- 50HZ. הבעיה עם PAL היא הקלה יותר, כל פריים מחולק לקוים זוגיים ואי זוגיים, והם מועברים לוידאו ישירות – כל פריים מוצג כעת פעמיים (לשיטה זו קוראים 2:2 PULLDOWN). הבעיה היא שזה נותן 48HZ, מספר קרוב ל-50HZ אבל עדיין לא פותר לחלוטין את הבעיה. הפיתרון הוא האצה של הסרט ב-4%, דבר אשר מוריד בגירסאת ה-PAL כ-5 דקות ממרבית הסרטים…


עבור NTSC המצב יותר מסובך. המעבר בין פילם לוידאו במקרה זה דורש שינויים מעט יותר דרסטיים.



השיטה שנבחרה עבדה מצויין למשך השנים ושמה בישראל: 3:2 pulldown. בשיטה זו, כל FRAME מפוצל לשני FIELDS כאשר מדי חמש FIELDS חוזר אחד מהם פעמיים (כפי שנראה בציור, A1 ו-C2 חוזרים על עצמם פעמיים) – לסדר הזה קוראים CADENCE. כך, לאורך זמן מתכזז ההפרש ונוצר לו אלגוריתם תאום מושלם מ- 24FPS הישר ל- 60HZ. החיסרון של השיטה הוא תוספת של rnJudder
אשר מתווסף לתמונה.


בשלב זה נכנס לתמונה בחור בשם YVVES FAROUDJA אשר הבין שאם יצליח לשחזר את הפעולה של TELECINE, הוא יוכל לקבל את הפריים המקורי בחזרה. בפטנט שלו, הוא הצליח לגלות את ה-SEQUENCE על ידי זיהוי של שני הפילדים הזהים ב-SEQUENCE. האלגוריתם ניקרא: inverse 3:2 telecine. כאשר מקור וידאו כולל את השילוב הזה, הוא נקרא FILM MODE בשל העובדה שמקורו בפילם. כמובן שלא רק סרטים מצולמים ב-FILM MODE. סדרות טלויזיה ותכנים אחרים מצולמים בפילם על מנת לשמר את איכות התמונה ולתת לזה את מגע הקסם של הפילים. בנוסף, מצלמות HD חדשות מצלמות לעיתים ב- 24FPS, מה שגורם לתכנים שלהם להחשב FILM MODE.rn


כמובן שהחיים לא תמיד כה מוצלחים. בעוד שב-NTSC קל לזהות את תחילת ה-SEQUENCE של חמשת ה-FIELDS, הדבר קשה הרבה יותר עבור PAL. במקרה של PAL יש סיכוי של 50% לקלוע למטרה. בניגוד ל-NTSC אין כאן חזרה על FIELD מסויים, והדבר מקשה עד מאוד על הזיהוי המושלם. לפיכך, נעילה של FILM MODE ב-PAL קשה הרבה יותר והרבה פחות ודאית. השיטה המקובלת היא בדרך כלל ניסוי וטעיה – האלגוריתם מניח שמדובר ב-FILM MODE ומנסה את שני השכנים (זה שלפני הפריים הנוכחי, וזה שאחריו) על מנת לנסות ולראות באיזה שילוב ניתן לקבל מינימום COMBING.rnrn




מקור וידאוrn




מקור וידאו מוגדר כמקור ללא FILM MODE. כלומר, מקור אשר לא ניתן למצוא שני פילדים שכנים אשר מתאימים בשילובם. שילוב לא מתאים גורם לתופעת ה-rnCombing
המרגיזה (במיוחד מרגיזה על גבי מסכים גדולים).




ישנם שיטות רבות לנסות ליצר תמונה שלמה כאשר שני חצאי התמונה לא מתגבשים לכדי תמונה אמיתית. השיטה הפשוטה ביותר נקראת BOB/WEAVE. בשיטה זו כאשר אין כלל תזוזה בתמונה, שני ה-FIELDS השכנים פשוט משולבים (WEAVED) ללא בעיה. כאשר יש תזוזה (ועלול להיווצר מצב של COMBING), המערכת מיד עוברת למצב BOB ומייצרת FRAME שלם אשר בעצם מורכב מה-FIELD הנוכחי מוכפל (לפי שיטת rnLine doubling. כמובן שבשיטה זו, יש COMBING מדי פעם וירידה משמעותית של איכות התמונה כאשר יש תזוזה על גבי המסך.rn


את המוצרים הראשונים בתחום יצרה חברת FAROUDJA אשר כמובן היו להיט במיוחד במקרני CRT גדולים (אשר בעיקר עשו שימוש ב-FILM MODE).rnrn




מקור מחשבrn




גם אנימציות ומקורות ממוחשבים חייבים ליצר תמונה INTERLACED, שכן זה התקן. לעומת FILM MODE, מרבית הפתרונות הממוחשבים עובדים מראש על FRAME שלם, ולכן מפרקים אותו לכדי שני FIELDS בשיטה זהה ל 2:2 PULLDOWN. על מנת לשחזר את הוידאו, יש לבצע את אותם פעולות של שיחזור ב-PAL.rnrnrn




שילוב השנייםrn




במקרה של DVD, יש רמזים נוספים שלא קיימים במקורות אחרים. ב-DVD קיים לפני כל FIELD דגל קטן שמסמן כמה פעמים יש לחזור על ה-FIELD. בשיטה זו, ניתן להכניס מקור של 24FPS לתוך הדיסק ועדיין להיות מסוגלים לייצר 3:2 PULLDOWN בעזרתו האדיבה של הנגן עצמו. במכשירי DVD רבים ההחלטה לגבי אסטרטגיית ה-DEINTERLACING מתבצעת על כסיס דגלים אלו. אך אליה וקוץ בה. מסתבר שהדגלים פשוט אינם נכונים בדיסקים רבים. תהליך העריכה וההמרה הוא ארוך ומסובך ובמקרים רבים עובר עריכה מחודשת אשר אינה מתחשבת בסדר הדגלים או ה-FIELDS. מקרים כאלה שהסדר מתבלבלים נקראים BAD EDIT. קפיצה של 3:2 עלולה לגרום ל-COMBING מוגבר אם היא איננה מסומנת. דגלים מוטעים עלולים להוריד משמעותית את איכות התמונה.rn


במקרה של פרוססורים חיצוניים (מכשירים או צ'יפים כגון FLI2300 של פרודג'ה או Sil504 של סיליקון גרפיקס) אין כלל הסתמכות על הדגלים והמידע על ה-FILM MODE נוצר על סמך המידע בשטח בלבד.rnrn




מצב וידאו מתקדםrn




עם הזמן, השתכללו שיטות מצב הוידאו (חברת FAROUDJA הובילה את התחום) על ידי טכניקות שונות. שיטה אחת בשם MOTION ADAPTIVE משכללת את שיטת BOB/WEAVE על ידי ניסיון לחלק את התמונה לאזורים קטנים יותר ויותר ולנסות לבצע BOB/WEAVE על המקטעים הללו. בשיטת pixel adaptive הטווח הזה יורד כמעט עד לרמת הפיקסל. בשיטת Edge Adaptive מנסה האלגוריתם לזהות קצוות אובייקטים ומחפש תזוזות וקטוריות באזורים הללו. שיטות חיפוש וקטוריות מגדירות אזור ומנסות לאפיין את וקטור התזוזה שלו (כלומר לאן הקטע זז ובאיזה טווח). ככל שהשיטות משתכללות, כמות הטעות עלולה להיות יותר גדולה. לפיכך, מרבית השיטות משלבות טכניקות שונות אשר רצות במקביל ומנסות למצוא את הפיתרון האופטימלי במצב נתון.rn


נושא בעייתי נוסף עם שיטות אלו הוא טפולן בגבולות אובייקטים אלכסוניים עם זוית נמוכה. מצב זה מיוחד בשל כך שמדובר במעט מאוד מידע נתון אשר מתפצל בין שני ה-FIELDS. במקרה של טעות עלול להיווצר מצב בילתי נסבל של חוט בין שני עמודי חשמל אשר פשוט נעלם מדי פעם ומופיע במקרים אחרים באופן מודגש. כדי לנסות לאתר מקרה קצה זה, ועל מנת לפתור בעיה נוספת בשם rnStaircasing. אלגוריתמים כגון DCDI נלחמים בתופעה על ידי זיהוי וטשטושה.rn


שיטה מתקדמת יותר נקראת MOTION COMPENSATION אשר מנסה לתת לכל פיקסל במסך וקטור תזוזה. על ידי ניסוי וטעייה, ניתן להגיע לדיוק מירבי בשיטה זו וליצור תמונה אשר קרובה מאוד לאיכות FILM MODE גם עבור מקורות גרועים במיוחד. לרוע המזל, הדבר דורש כוח חישוב עצום וכיום לא ניתן להשיג פיתרונות מסוג זה בעלות "סבירה". מרבית המשתמשים בפתרונות מסוג זה הם בשוק ה-BROADCASTING, בתחום המחקר (למשל אסטרונומיה) או בתחומי הביון והצבא.rn


0:02
  /  
15.11.2004
  
מאמר זה נכתב על ידי עפר לאורrn

1