A quick thought on the compressability of language.

2 Nov 2006

עברית, הרגילה לכתיבה בכתב חסר, מתאימה הרבה יותר לסגנון הכתיבה ה-SMSי המתוקצר. אפשר להביע יותר בפחות אותיות. קיצוץ התנועות באנגלית צורם הרבה יותר.

מצד שני, האם השימוש הנרחב ב-vowels באנגלית משפר את יכולת הכיווץ ע”י אלגוריתמי כיווץ כאלה ואחרים?

2 בNovember, 2006 בשעה 14:16

A few weeks ago we were playing Hebrew scrabble and noticed how much easier it is in the holy language then in english. Mainly, we discussed the fact that most two letter combinations in hebrew are actual words in the language, whereas english does not have this trait (except google searching english).



5 בNovember, 2006 בשעה 10:10

Ironically enough, Hebrew SMS’s are restricted to 70 characters, while English ones can be twice as long. There is no storage/programming logic to this, except perhaps the inability of foreign manufactured mobile phones to decipher/display hebrew text, at which case the extra 70 characters serve as some sort of ‘mask’ or codec.
Actually, that’s a silly idea, even for Israeli cellular companies.
So why the hell are Hebrew SMS’s thus shortened?




2 בDecember, 2006 בשעה 11:54

נו באמת!

איזה מין מדעניות זאת? אני אגיד אותך למרק ליברמן! כמה זה כבר קשה לקחת מדגם מייצג של טקסטים בעברית ואנגלית באותו אורך ולבדוק מדעית את ההבדלים בכיווץ?!

ולגבי האורך של ה-SMS, הניחוש שלי הוא ש-SMS בעברית הולך ביוניקוד מאיזשו סוג, ולכן אנחנו מקבלים בערך חצי באורך. למישהו יש נסיון עם רוסית?! ערבית?.


