为什么粤语中有很多不认识的汉字?
粤语中有大约15%的壮侗底层词汇,这些词汇转写为汉语时大多用表音字或同音字代替,如“呢度”(这里)的“呢”,表示倒塌的“冧”,表示痒的“痕”,表示欺负的“虾”等。而本身继承而来的汉语字词中,又有相当一部分由于历史传承、发音变化等等因素影响,而丢失了原本的写法,由此新造了大量口字边的俗字或是用其它同音字代替。比如表示人称众数的“哋”来源于“等”,“在”字在口语中转音后写为“喺”,领属关系词“嘅”来源于“个”,疑问代词“点”和“怎”同源,中古来源是“底物”的合音,指示代词“咁”中古来源于“个物”的合音,而“物”字做疑问词时又转写成“乜”,诸如此类。这些俗字其实也有相当长的历史,在明末清初时广东文人屈大均所著的《广东新语》一书中,就有提到:“广州谓美曰靓...谓聪明曰乖,谓不曰吾,问何如曰点样。”说明至少在明代已经有“靓“、”点样”、“吾(唔)”这一写法。而一些古汉语中固有的字词,如“畀”(给)、“企”(站)、“争”(相差,欠)、“攰”(累)等字在普通话中已经偏离原意,粤语则保留了这些用法,因此若是不了解它们的古义的话,也会产生理解歧义。再有另一些词,则是对古楚语的继承。如题主截图中的“睇”,和“看”同义。《说文解字》注:南楚谓眄曰睇。粤语语音体系的主体层次大概在唐末至五代,也就说明粤语在那时起已经与官话分流发展。在普通话中,表示近指和远指的“这”、“那”,表示人称复数的“们”以及表示疑问的“怎”都是从宋代开始起源 (这 最初写为 者,早期来源不明;那 来源可能是 恁 )。而粤语则没有跟随官话在中古以后的变化,由此可见,至少在宋朝,官话和粤语的口语用词已经分流。
因为没有人能认识全部汉字,每种方言都有自己的一些常用或特殊词汇而普通话中没有的,而我国的单一语言政策造成大多数的人是没有学过自己的方言字是怎么写的,所以也就简单粗暴地以为方言是没有字的(普通话发明以前的古人们非气活过来不可),这一点上粤语由于其特殊的历史和地缘政治,所以比其他方言存在感更强,母语教育也相对完善,所以题主才产生粤语有很多不认识的字的错觉。不过粤语人的粤语水平也是一代不如一代了,大陆强行推普不说了,年轻一代不会写甚至不会说粤语,港人本就不重视中文,我脸书上的香港朋友经常发出“我系呢个group geh leader wo”这种夹杂着本字,白字,英文,拼音的状态,不过这个是另一个话题了。