语言学概论两个最大的语系的区别
展开全部
1、 语言的起源 一是,神授说 二是,人创说:人创说的各种学说的主张语言是人的创造,而不是上帝或是神的赐予,这比起神授说,应该说是一个很大的进步。恩格斯在<劳动在从猿到人的转变过程中的作用>一文中,提出了劳动创造语言,语言起源于劳动的观点。
2、 (1)语言是不断发展演变的。(2)语言发展演变的原因 A社会的进步会推动语言的发展。B 社会的分化和统一会推动语言的发展演变 C 社会之间的接触也会推动语言的发展演变。 从根本上讲,语言的存在和发展是受社会制约的,社会交际的需要时语言存在和发展的基本条件,但这并不意味着一种语言中的每一项具体演变和发展都有其直接的社会根源。在古代汉语中单音节词是构词的主要的模式,可是发展到现代汉语,词汇中的词大都是双音节的,双音节词成了汉语的主要构词模式。 语言是用来表达思想、交流信息的符号系统,它必须能够利用自身的形式手段把不同的意义区别开来,达到表意的明确性。古代汉语中原本单音节词占优势,当时汉语的语音系统比较复杂,因而这些单音节词之间可以保持有效地区别。(3)语言发展演变的特点:渐变性和不平衡性是语言演变发展的两大特点。
第二节 语言的分化和统一
1、 语言随社会的分化而分化 在一定的社会政治历史条件下还可能使一种语言的方言成为不同的“亲属语言”;社会的社群分化会导致语言的社群分化,在一种语言或方言内部形成不同的“社会方言”。从同一种语言中分化出来的各个语言,叫做“亲属语言”亲属语言有共同的来源,这些语言之间具有历史同源关系,这种关系被称作亲属关系。世界上的诸语言按其亲属关系大致可以分为汉藏语系、印欧语系、乌拉尔语系、阿尔泰语系、闪含语系、达咯昆荼语系、马来---波利尼西亚语系、南亚语系九大语系以及其他一些语群和语言,汉藏语系和印欧语系是使用人数最多的两个语系。
2、 社会方言 在一个语言社会中,不同的人说话可能会使用不同的语言变体二呈现出不同的特点这些不同的语言变体和特点又同说话人的社会特征相关联,同一定的社群联系在一起,这种语言或地域方言内部同一定的社会特征和社群相关联的变体和特点被称之为“社会方言”。A阶级和阶层的差别会对语言产生影响 B职业的差别也会对语言产生影响C年龄的差别也可能对语言产生影响D 性别的不同也可能在一定的程度上影响语言。
3、 语言随社会的统一而统一 一种语言的共同语并不是凭空产生的,而是在某一个方言的基础上形成的
第三节 “双语现象”是指某一语言社团使用两种或多种语言的社会现象。
“语言转化”是随着不同的民族的接触和融合而产生的一种重要的语言现象,指的是一个民族的全体或部分成员放弃使用本民族语言而转用另一民族语言的现象,也有人称之为“语言交替”。
语言混合的形式有“洋泾浜语”和“克里奥耳语”。 洋泾浜语产生之后,它的命运主要由社会环境的变迁和社会交际的需求来决定。其发展前途有两个:一个是随着社会交际环境的变迁而消亡,一个是在社会交际需求的推动下,发展为克里奥耳语,成为一个国家或一个地区通用的交际工具。
第四节 语言规划 社会对语言文字问题所作出的有组织的、有意识的管理、调节和改进,被称之为‘语言规划’
官方语言的选择 从理论上说,选择官方语言应该充分考虑到本国,本民族的或本国各民族的长远利益,应该选用国内多数人使用的语言,或是国内经济文化发展水平较高因而较有影响的民族的语言。
民族语言政策 主要是关于一个国家内部少数民族语言的政策,
1、 少数民族语言文字的法律地位 各民族的公民都有用本民族语言进行诉讼的权利。
2、 少数民族的语言教育 少数民族的语言教育涉及两个方面:一是少数民族是否有接受本民族语言教育的权利。二是,少数民族在各级教育机构中使用哪一种语言来接受教育。我国现在在少数民族教育方面实行双语政策,一方面保障各少数民族学习本民族语言文字的权利,一方面推行全国通行普通话。
第八章 语言和心理
语言是思维的最重要的工具
先有思维还是先有语言一种意见认为,思维和语言有各自的发展过程,二者不是一回事,也没有多少关系,甚至语言出现后还干扰了纯正的思维。第二种意见认为,语言和思维同时发生,而且由于坚持思维只能在语言的基础上才能进行,所以如果一定要分出先后,那么甚至应该先有语言然后才有思维。与上面两种意见都不同的第三种意见则认为思维是先于语言发生的,虽然语言出现后形成了思维的主要工具,但语言出现前人类就有了思维,甚至知道出现语言之后也存在着不需要语言参与的思维活动。主张第三种意见的主要是自然学家,而且他们都更多地采用了科学实验的方法。这些科学实验不但从生物学,生理学,心理学,病理学等很多方面,进一步充分证明了人的思维在很大程度上必须借助语言来进行,同时也提供了思维有先于语言而产生和脱离语言而存在的更客观的证据。这其中值得注意的主要有3方面的研究成果:一是从人类的系统发生学。二是从人类的个体发生学。三是从大脑受到损伤,丧失了语言能力或思维能力的病理现象。 目前在思维和语言的起源产生问题上比较倾向于一致的观点是:一方面承认语言与思维却是密不可分,至少在语言出现以后它是人类思维的最主要的工具;另一方面又承认人类的思维可能先于语言产生,或是说人类是先有思维后有语言的。
思维的三大类型:一类是‘感性思维’二类是‘抽象思维’三类是‘发散思维 ’
在思维和语言的范围和功能对应问题上比较倾向于一致的观点是:人类的思维活动有不同的类型,其中抽象思维是必须借助语言进行的思维活动,抽象思维以外的其他思维活动;如感性思维和发散思维不一定需要语言参加,但语言也在这些思维活动中起作用。
目前在语言和思维的地位作用的问题上比较一致的观点是:在语言和思维的关系中,思维起主导作用,思维决定语言。语言虽然对思维活动有一定的影响,但不能无限夸大这种影响,语言也不能最终决定人的思维发生和思维活动。
心里语言学就是研究这种大脑构造和语言能力的关系问题。人会说话是一种自然而然的获得过程,甚至是一种创造过程。儿童学会说话,特别是学会自己母语的这种过程,心理学的术语叫做‘语言获得’大脑左半球掌管右半身的动作,大脑右半球掌管左半身的动作。
‘单侧化’的意思是,人的大脑左右两个半球并不是完全对称的,不但大小略有差别,而且有明确的分工,即左半球的一定部位掌管语言和抽象的思维活动;而右半球的一定部位掌管与语言无关的直观动作的思维活动。
‘失语症’因大脑不同部位受到损失而造成的语言障碍系统。
‘失写症’不能写过去认识的字,或者写出来的也是乱七八糟的。
‘失读症’不能读懂本来可以阅读的书面材料。
‘临界期’的意思是,不管是大脑的单侧化,大脑左半球的分区,还是语言的遗传机制,都只是提供人具有语言能力的潜在可能性,但这些潜能必须在一定期限内被一定的语言环境激活才可能起作用,否则大脑的语言功能就会失效。人也就不会说话了。如果过了十二至十三岁的青春期,左右半球的功能已经定型,那时左半球再受损伤,丧失的语言能力就很难恢复了。
大脑的语言功能确实有一部分是先天的,只要经过某种后天学习,不管是有声语言环境还是手势语环境,都有可能激活大脑的这种功能,并进而使人具有完备的语言能力,或者是有声语的语言能力,或者是手势语的语言能力。而后天的各种语言学习则必须发生在临界期内,否则不但单靠遗传的语言机制是不可能发展成为完备的语言能力,这种先天机制本身也会失去作用。
儿童语言获得的过程1、非自控阶段 婴儿出生到一岁左右就属于语言前阶段,或叫语言准备阶段。其中前6个月就是非自控阶段。2、咿呀学语阶段 儿童大约6个月到一岁左右是语言前阶段中的咿呀学语阶段。3、单词阶段 儿童一岁左右就进入了真正的语言阶段,也就是能开口说话了。4双词阶段 儿童一岁半到两岁的时候开始进入了双词阶段、5、简单句阶段 儿童在两岁或两岁半就进入了多个实词连接的简单句阶段。6复杂句阶段
儿童获得语言的原因和条件 1、模仿说。2、强化说。3、天赋说。4、认知说、
儿童语言获得倾向一致的看法可以归纳为以下几点:一是儿童的语言发展肯定具有先天的生物学基础,特别是大脑的语言功能或语言遗传机制起着决定性的作用;二是语言环境是儿童获得语言的必须条件;三是儿童的认知能力的发展影响儿童的语言获得,其中包括知识积累的阶段性和智力发展的差异性也都有一定的作用。
语言在思维认知活动中的作用表现在3个方面:一是语言可以帮助完成人的认知过程,二是语言可以储存人的认知成果,三是语言可以改造人的认知能力。
语言和民族文化意识1、语言是重要的米民族标志,可以体现民族精神2、语言有鲜明的民族特点,可以反映民族的文化
2、 (1)语言是不断发展演变的。(2)语言发展演变的原因 A社会的进步会推动语言的发展。B 社会的分化和统一会推动语言的发展演变 C 社会之间的接触也会推动语言的发展演变。 从根本上讲,语言的存在和发展是受社会制约的,社会交际的需要时语言存在和发展的基本条件,但这并不意味着一种语言中的每一项具体演变和发展都有其直接的社会根源。在古代汉语中单音节词是构词的主要的模式,可是发展到现代汉语,词汇中的词大都是双音节的,双音节词成了汉语的主要构词模式。 语言是用来表达思想、交流信息的符号系统,它必须能够利用自身的形式手段把不同的意义区别开来,达到表意的明确性。古代汉语中原本单音节词占优势,当时汉语的语音系统比较复杂,因而这些单音节词之间可以保持有效地区别。(3)语言发展演变的特点:渐变性和不平衡性是语言演变发展的两大特点。
第二节 语言的分化和统一
1、 语言随社会的分化而分化 在一定的社会政治历史条件下还可能使一种语言的方言成为不同的“亲属语言”;社会的社群分化会导致语言的社群分化,在一种语言或方言内部形成不同的“社会方言”。从同一种语言中分化出来的各个语言,叫做“亲属语言”亲属语言有共同的来源,这些语言之间具有历史同源关系,这种关系被称作亲属关系。世界上的诸语言按其亲属关系大致可以分为汉藏语系、印欧语系、乌拉尔语系、阿尔泰语系、闪含语系、达咯昆荼语系、马来---波利尼西亚语系、南亚语系九大语系以及其他一些语群和语言,汉藏语系和印欧语系是使用人数最多的两个语系。
2、 社会方言 在一个语言社会中,不同的人说话可能会使用不同的语言变体二呈现出不同的特点这些不同的语言变体和特点又同说话人的社会特征相关联,同一定的社群联系在一起,这种语言或地域方言内部同一定的社会特征和社群相关联的变体和特点被称之为“社会方言”。A阶级和阶层的差别会对语言产生影响 B职业的差别也会对语言产生影响C年龄的差别也可能对语言产生影响D 性别的不同也可能在一定的程度上影响语言。
3、 语言随社会的统一而统一 一种语言的共同语并不是凭空产生的,而是在某一个方言的基础上形成的
第三节 “双语现象”是指某一语言社团使用两种或多种语言的社会现象。
“语言转化”是随着不同的民族的接触和融合而产生的一种重要的语言现象,指的是一个民族的全体或部分成员放弃使用本民族语言而转用另一民族语言的现象,也有人称之为“语言交替”。
语言混合的形式有“洋泾浜语”和“克里奥耳语”。 洋泾浜语产生之后,它的命运主要由社会环境的变迁和社会交际的需求来决定。其发展前途有两个:一个是随着社会交际环境的变迁而消亡,一个是在社会交际需求的推动下,发展为克里奥耳语,成为一个国家或一个地区通用的交际工具。
第四节 语言规划 社会对语言文字问题所作出的有组织的、有意识的管理、调节和改进,被称之为‘语言规划’
官方语言的选择 从理论上说,选择官方语言应该充分考虑到本国,本民族的或本国各民族的长远利益,应该选用国内多数人使用的语言,或是国内经济文化发展水平较高因而较有影响的民族的语言。
民族语言政策 主要是关于一个国家内部少数民族语言的政策,
1、 少数民族语言文字的法律地位 各民族的公民都有用本民族语言进行诉讼的权利。
2、 少数民族的语言教育 少数民族的语言教育涉及两个方面:一是少数民族是否有接受本民族语言教育的权利。二是,少数民族在各级教育机构中使用哪一种语言来接受教育。我国现在在少数民族教育方面实行双语政策,一方面保障各少数民族学习本民族语言文字的权利,一方面推行全国通行普通话。
第八章 语言和心理
语言是思维的最重要的工具
先有思维还是先有语言一种意见认为,思维和语言有各自的发展过程,二者不是一回事,也没有多少关系,甚至语言出现后还干扰了纯正的思维。第二种意见认为,语言和思维同时发生,而且由于坚持思维只能在语言的基础上才能进行,所以如果一定要分出先后,那么甚至应该先有语言然后才有思维。与上面两种意见都不同的第三种意见则认为思维是先于语言发生的,虽然语言出现后形成了思维的主要工具,但语言出现前人类就有了思维,甚至知道出现语言之后也存在着不需要语言参与的思维活动。主张第三种意见的主要是自然学家,而且他们都更多地采用了科学实验的方法。这些科学实验不但从生物学,生理学,心理学,病理学等很多方面,进一步充分证明了人的思维在很大程度上必须借助语言来进行,同时也提供了思维有先于语言而产生和脱离语言而存在的更客观的证据。这其中值得注意的主要有3方面的研究成果:一是从人类的系统发生学。二是从人类的个体发生学。三是从大脑受到损伤,丧失了语言能力或思维能力的病理现象。 目前在思维和语言的起源产生问题上比较倾向于一致的观点是:一方面承认语言与思维却是密不可分,至少在语言出现以后它是人类思维的最主要的工具;另一方面又承认人类的思维可能先于语言产生,或是说人类是先有思维后有语言的。
思维的三大类型:一类是‘感性思维’二类是‘抽象思维’三类是‘发散思维 ’
在思维和语言的范围和功能对应问题上比较倾向于一致的观点是:人类的思维活动有不同的类型,其中抽象思维是必须借助语言进行的思维活动,抽象思维以外的其他思维活动;如感性思维和发散思维不一定需要语言参加,但语言也在这些思维活动中起作用。
目前在语言和思维的地位作用的问题上比较一致的观点是:在语言和思维的关系中,思维起主导作用,思维决定语言。语言虽然对思维活动有一定的影响,但不能无限夸大这种影响,语言也不能最终决定人的思维发生和思维活动。
心里语言学就是研究这种大脑构造和语言能力的关系问题。人会说话是一种自然而然的获得过程,甚至是一种创造过程。儿童学会说话,特别是学会自己母语的这种过程,心理学的术语叫做‘语言获得’大脑左半球掌管右半身的动作,大脑右半球掌管左半身的动作。
‘单侧化’的意思是,人的大脑左右两个半球并不是完全对称的,不但大小略有差别,而且有明确的分工,即左半球的一定部位掌管语言和抽象的思维活动;而右半球的一定部位掌管与语言无关的直观动作的思维活动。
‘失语症’因大脑不同部位受到损失而造成的语言障碍系统。
‘失写症’不能写过去认识的字,或者写出来的也是乱七八糟的。
‘失读症’不能读懂本来可以阅读的书面材料。
‘临界期’的意思是,不管是大脑的单侧化,大脑左半球的分区,还是语言的遗传机制,都只是提供人具有语言能力的潜在可能性,但这些潜能必须在一定期限内被一定的语言环境激活才可能起作用,否则大脑的语言功能就会失效。人也就不会说话了。如果过了十二至十三岁的青春期,左右半球的功能已经定型,那时左半球再受损伤,丧失的语言能力就很难恢复了。
大脑的语言功能确实有一部分是先天的,只要经过某种后天学习,不管是有声语言环境还是手势语环境,都有可能激活大脑的这种功能,并进而使人具有完备的语言能力,或者是有声语的语言能力,或者是手势语的语言能力。而后天的各种语言学习则必须发生在临界期内,否则不但单靠遗传的语言机制是不可能发展成为完备的语言能力,这种先天机制本身也会失去作用。
儿童语言获得的过程1、非自控阶段 婴儿出生到一岁左右就属于语言前阶段,或叫语言准备阶段。其中前6个月就是非自控阶段。2、咿呀学语阶段 儿童大约6个月到一岁左右是语言前阶段中的咿呀学语阶段。3、单词阶段 儿童一岁左右就进入了真正的语言阶段,也就是能开口说话了。4双词阶段 儿童一岁半到两岁的时候开始进入了双词阶段、5、简单句阶段 儿童在两岁或两岁半就进入了多个实词连接的简单句阶段。6复杂句阶段
儿童获得语言的原因和条件 1、模仿说。2、强化说。3、天赋说。4、认知说、
儿童语言获得倾向一致的看法可以归纳为以下几点:一是儿童的语言发展肯定具有先天的生物学基础,特别是大脑的语言功能或语言遗传机制起着决定性的作用;二是语言环境是儿童获得语言的必须条件;三是儿童的认知能力的发展影响儿童的语言获得,其中包括知识积累的阶段性和智力发展的差异性也都有一定的作用。
语言在思维认知活动中的作用表现在3个方面:一是语言可以帮助完成人的认知过程,二是语言可以储存人的认知成果,三是语言可以改造人的认知能力。
语言和民族文化意识1、语言是重要的米民族标志,可以体现民族精神2、语言有鲜明的民族特点,可以反映民族的文化
展开全部
摘要:本文采用“以小人之心度君子之腹”的套路,主要基于高中所学知识,对语言学的基础知识,即语言文字的出现和发展、特点和变化进行了总结,并提取了一些自然语言处理的背景知识,以加深对NLP的理解。
1. 引言
自然语言处理(Natural Laguage Processing, NLP)是人工智能领域最火热的方向之一,大家在里面投入了大量的人财物,完成了不少有意义的工作,比如效果良好的翻译工具、实用的智能个人助理、越来越善解人意的推荐系统等等。作为这方面的工程师,我似乎在算法的汪洋大海中迷失了。
为什么这么说呢?NLP这门学科的目标是实现机器和人的无障碍交流,并为此融合了语言学、计算机科学、数学等学科的理论和方法——而我,咔咔学了这几年,几乎没有语言学方面的积累,几乎没有意识到语言学和NLP中的联系。
最近,我仔细看了叶蜚声和徐通锵的《语言学纲要》,并基于本人在NLP方面(不多的)积累进行了简单思考,最后以博客的形式记录下来。
2. 从自然、意识、语言、口语到书面语——这是历史的进程
我们常说提升生产力是历史进程的最终方向。这个不仅适用于我们的经济社会发展,也适用于语言的出现和发展。
2.1. 意识是自然的主观映像
自然,可以粗暴地理解为整个宇宙,文雅的叫法是客观世界。我们人类有一定的能力,可以观察、记忆甚至解释一些事物——结果就是我们的大脑中存储了这些事物的外貌、温度等等信息,就是我们的意识,也叫做主观映像。当然,我们还有利用事物的意识、改造事物的意识等等。比如说,我们的祖先遭遇如图2-1所示的巨大物体后,一定会害怕、担心被干掉,这时候祖先就得记住这个东西、下次遇到要快速响应。
图2‑1 现代人叫亚洲象
2.2. 语言是表达意识的工具
很久很久以前,动物们用声音、图形、动态图像等等原始信号来表示主观映像。听着声音,祖先们就可以判断脚下的树枝是不是要被压断了;看看同伴的眼神,就知道他是不是要给你挠头;闻闻气味,就知道小宝宝是不是又拉了。从上帝视角来看,这种方案有一个重大缺陷:可以支持个体思考,但是无法支持同伴之间的快速交流。如果同伴之间不能传递信息,就无法传递历经艰险得到的知识。
不知道的自然选择的结果,还是祖先们有意识决定的,后来,祖先们开始主要用嘴、喉咙发出的声音来传递信息,比如(扯淡)用一个音素“wen”代表蜜蜂、同伴说这个就得赶紧跑。声音这种信息载体有一个特点,就是解放了四肢,允许大家一边跑一边叫。使用声音沟通时,祖先们可以进行带有“即时战略”特点的活动,比如在不影响逃跑速度的情况下告诉同伴们逃跑队形和集合地点。事后诸葛亮一下:使用声音沟通,提升了生产力,是生物挑选信息交流方式进程的最佳结果。
不知道是自然选择的导致的,还是祖先们勤加练习的结果,后来,祖先们可以发出越来越多的声音,以满足越来越强的认知能力所带来的越来越大的表达需求。这一时期,祖先们还发现,一段声音和另一段声音可以组合,形成一段更长的声音、表示另一种意思——这样,他们就可以用非常少的声音素材,描述非常多的事物。举例来说,如果我们可以发N种声音,一段包含K个音素的声音,可以表示种事物(要是加上我们现在使用的音调机制,那就更多了)。用于表示一个事物的音素组合,就是后人称为“词语”的东西。
不知道是自然选择的导致的,还是祖先们有约定的结果,后来,祖先们把词语搭配的形式和规则固定下来,形成了我们现在称为语法的东西。语法的存在,让语言更有规律,编码、解码和学习的成本更低,更有利于大家的交流,也就能进一步提升祖先们的生产力。到这个时候,祖先们称得上是文武双全、天下无敌,可以用复杂的队形和策略去狩猎,如图2-2。
图2‑2 某地岩画
在自然选择的作用下、在祖先们的个人奋斗下,语言和我们的意识相互依存、相互促进,发展成了今天这个样子。
2.3. 口语是语言的天然存在形式
如前所述,声音这种信息载体,由于相对于图像等有着巨大的优势,最终成为我们交流信息的主要形式。对应地,我们的主要通过口语来进行沟通活动。因此,口语成为语言的天然存在形式。
2.4. 书面语是提升意识、语言传播能力的工具
当然,相比声音,图像形式的信息也有独特的优势:可以跨越时间和空间进行传播。石头上的刻痕、木棍上的绳结,可以把信息传递给子子孙孙或者远在天边的另外一个部落。单凭声音,祖先们无法做到这一点——声音转瞬即逝,编码、解码容易出错,个体寿命有限等等,都限制了以口语形式存在的信息。于是,祖先们利用各种方案表示语言,包括在石头上画画、绳子打结、种树等等。在使用这些方案的过程中,图形这种形式,由于生成和理解比较便捷,逐渐胜出、成为主流的语言表示方案,并逐渐发展成象形文字。文字的出现,很好的解决了社群规模越来越大的情况下,信息交流的迫切需求,进一步提升了祖先们的生存和生产能力。
3. 语言和文字的若干特点
对现代人来说,语言和文字是密不可分的,二者都是用来对客观世界进行编码的符号体系。语言用声音来编码意识,而文字通过编码语言来编码意识。
3.1. 语言是一套离散的编码系统
语言是一套离散的系统,我们用以对客观世界进行尽量近似的刻画。声音、图像等原始信号是连续的,可以非常精准地反映实际情况,而语言只能用“帮”“真棒”这样的离散取值来描述世界。
另外,由于能力所限,我们只能用语言描述客观世界的一小部分。因此,语言所记录的,是对客观世界原始特征进行采样和编码的结果。理论上,句子是可以无限长的,因此可以表达非常非常精确的意思。因此,语言与现实世界的关系,有点像我们对函数的多项式展开操作时,多项式与函数的关系。
3.2. 语言符号的层级性
“我是中国人”这句话,有多个层级。两个或者多个词语构成词组;多个词组构成短语;多个短语又构成了句子。因此,句子的结构具有层次性。
图3‑1 句子的结构
我们在做文本理解或信息抽取的时候,可以根据场景的特点选择合适的粒度。
3.3. 规则可以描述大部分语言现象
词语的搭配、短语的组合等等,大部分可以用类似“主+谓+宾”的规则来描述。我们写一些正则表达式就可以解析或者生成合法的句子。但是,总有一些语言现象不符合主流规则,比如“我们要自卫”这句话,按照现在主流的语序应该是“我们要卫自”。“自X”这种句式是古汉语的语法在现代汉语中的留存。现代汉语中不符合主流句法的现象还有很多。
语法和语义共同决定了一个句子的形态。因此,我们在解析句子或者生成句子的时候,既要考虑句法的合理性,又要考虑语义的合理性。比如说,“十獒创世纪”这句话,语法上没啥毛病,不过因为不符合事实(我就不展开来批判了),仍然是一个非法的句子。因此,我们在对语言建模的时候,实际上需要把客观世界的相关知识融合进来,才能更好地刻画语言。
语法和语义共同制约的存在,决定了句子中所有的元素两两之间,多多少少存在一定的联系。注意力机制特别适合用来刻画这种复杂关系,也催生了Transformer、BERT、GPT等经典的语言模型。
图3‑2 獒吹经典口号
3.4. 语言和文字的关系
文字是语言的编码,可以看做是语言的图形化版本。
我们使用文字对语言编码,进而实现对意识的编码,最终实现意识跨越时间和空间的传播。老子、孙子等人的意识片段,通过文字一直流传到了今天,不断地在后人的脑海里活跃着。
当然,文字在发展的过程中,逐渐出现了相对语言的独立性,比如中国人创造了书法这种艺术形式。古人在传承和学习文化典籍的时候,为了让后人也能看懂,规定书面语的语法不能变。结果随着时间的推移,人们的口语与书面语区别越来越大、学习古文的代价也越来越高。到了鸦片战争以后,人们终于不得不求变,废掉古文、提倡白话文。这时候,书面语又跟上了口语的脚步。
通常来说,NLP任务的直接处理对象是包含了文字的文本片段,毫无疑问,里面蕴含了人们的意图、情感等等。我们用词袋模型、词嵌入向量等等,刻画的不是那个字符串,而是文字所代表的意图和情感。
3.5. 表意文字和表音文字的关系
祖先们把图画发展成了象形文字,比如我国商朝时期的甲骨文、古苏美尔人创造的楔形文字等两河流域并传到今天、形成各种表意文字,比如成熟期的汉字、楔形文字。
由于汉语文化圈后来在所在地区一直是文化、生产力等方面的先进代表,文化的载体——汉语和汉字受到了统治者们的推崇,并被秦始皇等人定为国家标准语言,传承至今。
随着词汇规模的扩大,人们逐渐发现掌握语言变得越来越困难。一些民族为了减少或控制文字符号的数量,采用了一种新的策略,即用文字符号表示读音。这类语言的文字被成为表音文字,代表是英语。表音文字的特点是字符数量较少、易于学习,有利于语言的推广。
我们曾经试图将汉字拉丁化,以降低汉语的学习难度、尽快提升广大人民的文化水平。不过呢,共产党比较给力,通过推广简体字,很好的完成了扫盲任务。以王选为代表的科学家们,也用科学技术维护了汉字的生存空间。而拉丁版的中文就成了我们现在的拼音,用来记录和表达汉字的标准读音。
表意文字和表音文字各有所长,可见的未来里,都将继续存在。
4. 语言会变化
语言的变化是持续发生的,因此,我们的NLP系统需要经常进行相应的更新。
4.1. 语言变化的动力
语言出现和发展的根本动力,是我们为了获得生存优势,在一定成本下尽量多地传递信息的本能和意识。这也是我们提升生产力的需要。
语言发生变化的动力或者说原因非常多:
(1)先人们在生存和生产的过程中,不可避免会与其他群体发生接触,或多或少会进行交流(当然交流友好程度的取值范围是[和平,战争])。交流就意味着思维方式、表达方式等等方面的相互学习,就会导致语言的变化。我在边疆
1. 引言
自然语言处理(Natural Laguage Processing, NLP)是人工智能领域最火热的方向之一,大家在里面投入了大量的人财物,完成了不少有意义的工作,比如效果良好的翻译工具、实用的智能个人助理、越来越善解人意的推荐系统等等。作为这方面的工程师,我似乎在算法的汪洋大海中迷失了。
为什么这么说呢?NLP这门学科的目标是实现机器和人的无障碍交流,并为此融合了语言学、计算机科学、数学等学科的理论和方法——而我,咔咔学了这几年,几乎没有语言学方面的积累,几乎没有意识到语言学和NLP中的联系。
最近,我仔细看了叶蜚声和徐通锵的《语言学纲要》,并基于本人在NLP方面(不多的)积累进行了简单思考,最后以博客的形式记录下来。
2. 从自然、意识、语言、口语到书面语——这是历史的进程
我们常说提升生产力是历史进程的最终方向。这个不仅适用于我们的经济社会发展,也适用于语言的出现和发展。
2.1. 意识是自然的主观映像
自然,可以粗暴地理解为整个宇宙,文雅的叫法是客观世界。我们人类有一定的能力,可以观察、记忆甚至解释一些事物——结果就是我们的大脑中存储了这些事物的外貌、温度等等信息,就是我们的意识,也叫做主观映像。当然,我们还有利用事物的意识、改造事物的意识等等。比如说,我们的祖先遭遇如图2-1所示的巨大物体后,一定会害怕、担心被干掉,这时候祖先就得记住这个东西、下次遇到要快速响应。
图2‑1 现代人叫亚洲象
2.2. 语言是表达意识的工具
很久很久以前,动物们用声音、图形、动态图像等等原始信号来表示主观映像。听着声音,祖先们就可以判断脚下的树枝是不是要被压断了;看看同伴的眼神,就知道他是不是要给你挠头;闻闻气味,就知道小宝宝是不是又拉了。从上帝视角来看,这种方案有一个重大缺陷:可以支持个体思考,但是无法支持同伴之间的快速交流。如果同伴之间不能传递信息,就无法传递历经艰险得到的知识。
不知道的自然选择的结果,还是祖先们有意识决定的,后来,祖先们开始主要用嘴、喉咙发出的声音来传递信息,比如(扯淡)用一个音素“wen”代表蜜蜂、同伴说这个就得赶紧跑。声音这种信息载体有一个特点,就是解放了四肢,允许大家一边跑一边叫。使用声音沟通时,祖先们可以进行带有“即时战略”特点的活动,比如在不影响逃跑速度的情况下告诉同伴们逃跑队形和集合地点。事后诸葛亮一下:使用声音沟通,提升了生产力,是生物挑选信息交流方式进程的最佳结果。
不知道是自然选择的导致的,还是祖先们勤加练习的结果,后来,祖先们可以发出越来越多的声音,以满足越来越强的认知能力所带来的越来越大的表达需求。这一时期,祖先们还发现,一段声音和另一段声音可以组合,形成一段更长的声音、表示另一种意思——这样,他们就可以用非常少的声音素材,描述非常多的事物。举例来说,如果我们可以发N种声音,一段包含K个音素的声音,可以表示种事物(要是加上我们现在使用的音调机制,那就更多了)。用于表示一个事物的音素组合,就是后人称为“词语”的东西。
不知道是自然选择的导致的,还是祖先们有约定的结果,后来,祖先们把词语搭配的形式和规则固定下来,形成了我们现在称为语法的东西。语法的存在,让语言更有规律,编码、解码和学习的成本更低,更有利于大家的交流,也就能进一步提升祖先们的生产力。到这个时候,祖先们称得上是文武双全、天下无敌,可以用复杂的队形和策略去狩猎,如图2-2。
图2‑2 某地岩画
在自然选择的作用下、在祖先们的个人奋斗下,语言和我们的意识相互依存、相互促进,发展成了今天这个样子。
2.3. 口语是语言的天然存在形式
如前所述,声音这种信息载体,由于相对于图像等有着巨大的优势,最终成为我们交流信息的主要形式。对应地,我们的主要通过口语来进行沟通活动。因此,口语成为语言的天然存在形式。
2.4. 书面语是提升意识、语言传播能力的工具
当然,相比声音,图像形式的信息也有独特的优势:可以跨越时间和空间进行传播。石头上的刻痕、木棍上的绳结,可以把信息传递给子子孙孙或者远在天边的另外一个部落。单凭声音,祖先们无法做到这一点——声音转瞬即逝,编码、解码容易出错,个体寿命有限等等,都限制了以口语形式存在的信息。于是,祖先们利用各种方案表示语言,包括在石头上画画、绳子打结、种树等等。在使用这些方案的过程中,图形这种形式,由于生成和理解比较便捷,逐渐胜出、成为主流的语言表示方案,并逐渐发展成象形文字。文字的出现,很好的解决了社群规模越来越大的情况下,信息交流的迫切需求,进一步提升了祖先们的生存和生产能力。
3. 语言和文字的若干特点
对现代人来说,语言和文字是密不可分的,二者都是用来对客观世界进行编码的符号体系。语言用声音来编码意识,而文字通过编码语言来编码意识。
3.1. 语言是一套离散的编码系统
语言是一套离散的系统,我们用以对客观世界进行尽量近似的刻画。声音、图像等原始信号是连续的,可以非常精准地反映实际情况,而语言只能用“帮”“真棒”这样的离散取值来描述世界。
另外,由于能力所限,我们只能用语言描述客观世界的一小部分。因此,语言所记录的,是对客观世界原始特征进行采样和编码的结果。理论上,句子是可以无限长的,因此可以表达非常非常精确的意思。因此,语言与现实世界的关系,有点像我们对函数的多项式展开操作时,多项式与函数的关系。
3.2. 语言符号的层级性
“我是中国人”这句话,有多个层级。两个或者多个词语构成词组;多个词组构成短语;多个短语又构成了句子。因此,句子的结构具有层次性。
图3‑1 句子的结构
我们在做文本理解或信息抽取的时候,可以根据场景的特点选择合适的粒度。
3.3. 规则可以描述大部分语言现象
词语的搭配、短语的组合等等,大部分可以用类似“主+谓+宾”的规则来描述。我们写一些正则表达式就可以解析或者生成合法的句子。但是,总有一些语言现象不符合主流规则,比如“我们要自卫”这句话,按照现在主流的语序应该是“我们要卫自”。“自X”这种句式是古汉语的语法在现代汉语中的留存。现代汉语中不符合主流句法的现象还有很多。
语法和语义共同决定了一个句子的形态。因此,我们在解析句子或者生成句子的时候,既要考虑句法的合理性,又要考虑语义的合理性。比如说,“十獒创世纪”这句话,语法上没啥毛病,不过因为不符合事实(我就不展开来批判了),仍然是一个非法的句子。因此,我们在对语言建模的时候,实际上需要把客观世界的相关知识融合进来,才能更好地刻画语言。
语法和语义共同制约的存在,决定了句子中所有的元素两两之间,多多少少存在一定的联系。注意力机制特别适合用来刻画这种复杂关系,也催生了Transformer、BERT、GPT等经典的语言模型。
图3‑2 獒吹经典口号
3.4. 语言和文字的关系
文字是语言的编码,可以看做是语言的图形化版本。
我们使用文字对语言编码,进而实现对意识的编码,最终实现意识跨越时间和空间的传播。老子、孙子等人的意识片段,通过文字一直流传到了今天,不断地在后人的脑海里活跃着。
当然,文字在发展的过程中,逐渐出现了相对语言的独立性,比如中国人创造了书法这种艺术形式。古人在传承和学习文化典籍的时候,为了让后人也能看懂,规定书面语的语法不能变。结果随着时间的推移,人们的口语与书面语区别越来越大、学习古文的代价也越来越高。到了鸦片战争以后,人们终于不得不求变,废掉古文、提倡白话文。这时候,书面语又跟上了口语的脚步。
通常来说,NLP任务的直接处理对象是包含了文字的文本片段,毫无疑问,里面蕴含了人们的意图、情感等等。我们用词袋模型、词嵌入向量等等,刻画的不是那个字符串,而是文字所代表的意图和情感。
3.5. 表意文字和表音文字的关系
祖先们把图画发展成了象形文字,比如我国商朝时期的甲骨文、古苏美尔人创造的楔形文字等两河流域并传到今天、形成各种表意文字,比如成熟期的汉字、楔形文字。
由于汉语文化圈后来在所在地区一直是文化、生产力等方面的先进代表,文化的载体——汉语和汉字受到了统治者们的推崇,并被秦始皇等人定为国家标准语言,传承至今。
随着词汇规模的扩大,人们逐渐发现掌握语言变得越来越困难。一些民族为了减少或控制文字符号的数量,采用了一种新的策略,即用文字符号表示读音。这类语言的文字被成为表音文字,代表是英语。表音文字的特点是字符数量较少、易于学习,有利于语言的推广。
我们曾经试图将汉字拉丁化,以降低汉语的学习难度、尽快提升广大人民的文化水平。不过呢,共产党比较给力,通过推广简体字,很好的完成了扫盲任务。以王选为代表的科学家们,也用科学技术维护了汉字的生存空间。而拉丁版的中文就成了我们现在的拼音,用来记录和表达汉字的标准读音。
表意文字和表音文字各有所长,可见的未来里,都将继续存在。
4. 语言会变化
语言的变化是持续发生的,因此,我们的NLP系统需要经常进行相应的更新。
4.1. 语言变化的动力
语言出现和发展的根本动力,是我们为了获得生存优势,在一定成本下尽量多地传递信息的本能和意识。这也是我们提升生产力的需要。
语言发生变化的动力或者说原因非常多:
(1)先人们在生存和生产的过程中,不可避免会与其他群体发生接触,或多或少会进行交流(当然交流友好程度的取值范围是[和平,战争])。交流就意味着思维方式、表达方式等等方面的相互学习,就会导致语言的变化。我在边疆
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
语言学概论
第一章 语言和语言学
第一节 认识人类的语言
一、 只有人类才有语言(领会)(多选)
(一) 人类语言与其他动物鸣叫系统的区别:
1、 内容更多。
2、 用处更大。
3、 能够创造。
(二) 人类具有语言能力,是人类跟其他动物区别的最重要的标志。(单选)
二、 语言和民族、国家之间的关系(领会)(单选)(论述)
(一) 语言不但是最直观和最易识别的民族标志,同时还是国家的标志。
(二) 语言和民族、语言和国家之间存在着复杂的关系。(为什么汉语中吴语、粤语、闽语相互听不懂但仍属于汉语)(综合应用)
1、 一个民族使用一种语言。
2、 西方学者把“相互能够听懂”作为确定语言的标准。这种标准对于历史悠久、幅员辽阔的国家则不适用。
3、 “语言”和“民族”之间、“民族”和“国家”之间错综复杂的情况,才有做出更加符合客观事实的结论。
三、 语言特点与语言类型(说明不同类型语言的主要特点)(简单应用)
(一) 语言的谱系分类(领会)(名词解释)
1、 语言谱系分类:从语言“历时”状态角度来划分,根据各种语言在语音、语汇、语法等方面是否有共同的来源和相似性的大小对语言进行的分类。
2、 了解怎样区别不同的语言和不同的方言(领会)(单选)(多选):
(1) 谱系层次:语系—语族—(语支)—语言—方言—次方言(土语)
(2) 语系(识记):属于同一个语系的语言都有古老的共同来源。其中印欧语系和汉藏语系是两个最大的语系。
(3) 语族(识记):同一语族的语言不但有相同的来源,相似点也更多。
(二) 语言的形态分类(领会)
1、 语言形态分类(名词解释):从语言“共时”状态角度来划分不同的语言,其中一种主要的分类结果就是把人类语言分成“形态语”和“孤立语”,或者分成“综合性语言”和“分析性语言”。
2、 “形态语”和“综合性语言”(识记)(名词解释):通过词的形态变化来体现各种结构意义的语言。
(1) 屈折语(识记)(名词解释):主要是句子中某些词本身有丰富的形态变化,典型的如德语、俄语。
(2) 黏着语(识记)(名词解释):主要是句子中某些词的形态变化表现为在词的前后附有词缀,典型的如维吾尔语、日语。
3、 孤立语”和“分析性语言”(识记)(单选)(名词解释):属于没有形态变化的语言,如汉语。
四、 语言和言语
(一) 语言和言语的概念(单选)(名词解释)
1、 言语:言语动作和言语作品,又可以统称为“言语”。
2、 语言:说话时使用的符号工具。
(二) 语言和言语的关系:(领会)(易考)(单选)(简答)
1、 “语言”是更重要的,至少是决定“言语”的。
2、 “言语”又是更现实的,至少是比“语言”更容易直接观察到的
第一章 语言和语言学
第一节 认识人类的语言
一、 只有人类才有语言(领会)(多选)
(一) 人类语言与其他动物鸣叫系统的区别:
1、 内容更多。
2、 用处更大。
3、 能够创造。
(二) 人类具有语言能力,是人类跟其他动物区别的最重要的标志。(单选)
二、 语言和民族、国家之间的关系(领会)(单选)(论述)
(一) 语言不但是最直观和最易识别的民族标志,同时还是国家的标志。
(二) 语言和民族、语言和国家之间存在着复杂的关系。(为什么汉语中吴语、粤语、闽语相互听不懂但仍属于汉语)(综合应用)
1、 一个民族使用一种语言。
2、 西方学者把“相互能够听懂”作为确定语言的标准。这种标准对于历史悠久、幅员辽阔的国家则不适用。
3、 “语言”和“民族”之间、“民族”和“国家”之间错综复杂的情况,才有做出更加符合客观事实的结论。
三、 语言特点与语言类型(说明不同类型语言的主要特点)(简单应用)
(一) 语言的谱系分类(领会)(名词解释)
1、 语言谱系分类:从语言“历时”状态角度来划分,根据各种语言在语音、语汇、语法等方面是否有共同的来源和相似性的大小对语言进行的分类。
2、 了解怎样区别不同的语言和不同的方言(领会)(单选)(多选):
(1) 谱系层次:语系—语族—(语支)—语言—方言—次方言(土语)
(2) 语系(识记):属于同一个语系的语言都有古老的共同来源。其中印欧语系和汉藏语系是两个最大的语系。
(3) 语族(识记):同一语族的语言不但有相同的来源,相似点也更多。
(二) 语言的形态分类(领会)
1、 语言形态分类(名词解释):从语言“共时”状态角度来划分不同的语言,其中一种主要的分类结果就是把人类语言分成“形态语”和“孤立语”,或者分成“综合性语言”和“分析性语言”。
2、 “形态语”和“综合性语言”(识记)(名词解释):通过词的形态变化来体现各种结构意义的语言。
(1) 屈折语(识记)(名词解释):主要是句子中某些词本身有丰富的形态变化,典型的如德语、俄语。
(2) 黏着语(识记)(名词解释):主要是句子中某些词的形态变化表现为在词的前后附有词缀,典型的如维吾尔语、日语。
3、 孤立语”和“分析性语言”(识记)(单选)(名词解释):属于没有形态变化的语言,如汉语。
四、 语言和言语
(一) 语言和言语的概念(单选)(名词解释)
1、 言语:言语动作和言语作品,又可以统称为“言语”。
2、 语言:说话时使用的符号工具。
(二) 语言和言语的关系:(领会)(易考)(单选)(简答)
1、 “语言”是更重要的,至少是决定“言语”的。
2、 “言语”又是更现实的,至少是比“语言”更容易直接观察到的
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
语言学概论复习资料
一、名词解释
1.语言的主观性:说话者在话语中表达自己的情感、态度、意图。(互动的另一方面包括受话人受到影响,做出相应的语言或行动上的反馈。)
2.语言能力:人的抽象思维能力与灵活发音的能力有机结合。人的语言能力的生理基础相同。
3.心理现实:贮存在人脑的人对客观现实认知的成果,是关于客观现实的各种知识信息。 其来源:①感官对客观现实的直接感知,经脑神经综合处理转化为记忆信息;②对语言文字的接收处理。
4.颤音:舌尖或小舌连续颤动而发出的音。(是舌尖、小舌这两个柔软的尖状物处在十分放松并有气流的冲击的状态下连续颤动而发出的音。)例如:俄语中的Р(如РУка,手)是舌尖颤音[r]。
5.闪音:舌头颤动一次发出的音。例如:英语very中的处于弱读音节的r[ʃ]。
6.区别特征:具体语言中有区别音位作用的发音特征。每一个音位都可以分解为几个不同的区别特征。例如汉语普通话/ɑ/音位有不圆唇和舌位低两个发音特征;某个音位利用哪些特征和其他音位对立,这由该特征在音位系统中所处的地位而定。例如:英语音位用清/p/浊/b/对立而不同于汉语普通话的用是否送气来区别。
7.语言节奏:语言的节奏是狭义的节奏,是语流中某些超音段要素在时间上等距离地、周期性地交替出现。相当于音乐节拍但不如音乐规整严格。包括音节(或韵素)型节奏和音步型节奏。
8.成句范畴:语气(陈述、疑问、祈使、感叹)、情态、时、语态等句子功能意义类别。成句范畴有一定的表达形式,例如疑问句语气可以用语调或虚词表达。
9.黏着语:只以黏着语素替换作为表示语法关系的主要手段的语言。例如土耳其语、维吾尔语、芬兰语等。
10.概念结构:词义之间的相互关系叫做一种语言的概念结构,词义的形成以现实现象为基础,同时也受制于本语言词义的相互关系(概念结构)。不同的语言对现实有不同的切分,也就具有不同的概念结构。
11.中心意义:离开上下文后人们最熟悉的意义,它大多同本义一致,有时同本义不一致。中心意义是从多义词在某个时代各义项之间的关系的角度分析出的。例如,单独取出“兵”这个词,一般人首先想到的是“兵士”的意义。
二、相近概念的辨析
1.语言和言语
答:(1)语言是人类最重要的交际工具,是人们进行沟通交流的各种表达符号。言语是说出来的话;说出来的一个词。
(2)语言与言语的区别:
①语言是交际工具,非自由的,组词成句的规则有限;
②言语即说话,运用交际工具,是自由的,创造新句无限。
(3)语言与言语的关系:
①言语是对特定语言的具体运用;例如:他不言语。/ 他的言语和有趣。
②语言存在于各种各样的言语之中;
③没有言语就无所谓语言。
2.音系学和语音学
答:(1)音系学,又称音位学(phonemics),是研究语言的语音系统的一门学科,包括对当代语言的语音系统的分析和对历史语音变化的研究两个方面。后者在中国传统称为音韵学。
语音学(Phonetics)是对人类语言发音进行的研究,它包括建立一套描述语音的方法和体系,也包括与之相关的理论建构,还可以包括由此带来的应用前景。
(2)音系学和语音学的区别:
①语音学从自然属性角度研究人类所有语言的语音发音原理和听觉反应。
②音系学从社会属性角度研究语音在具体系统中的组织方式及其不同作用。
(3)语音学与音系学的联系:
①都关注语音在具体语言系统中的作用。
②音系学研究以语音学的成果为基础。
一、名词解释
1.语言的主观性:说话者在话语中表达自己的情感、态度、意图。(互动的另一方面包括受话人受到影响,做出相应的语言或行动上的反馈。)
2.语言能力:人的抽象思维能力与灵活发音的能力有机结合。人的语言能力的生理基础相同。
3.心理现实:贮存在人脑的人对客观现实认知的成果,是关于客观现实的各种知识信息。 其来源:①感官对客观现实的直接感知,经脑神经综合处理转化为记忆信息;②对语言文字的接收处理。
4.颤音:舌尖或小舌连续颤动而发出的音。(是舌尖、小舌这两个柔软的尖状物处在十分放松并有气流的冲击的状态下连续颤动而发出的音。)例如:俄语中的Р(如РУка,手)是舌尖颤音[r]。
5.闪音:舌头颤动一次发出的音。例如:英语very中的处于弱读音节的r[ʃ]。
6.区别特征:具体语言中有区别音位作用的发音特征。每一个音位都可以分解为几个不同的区别特征。例如汉语普通话/ɑ/音位有不圆唇和舌位低两个发音特征;某个音位利用哪些特征和其他音位对立,这由该特征在音位系统中所处的地位而定。例如:英语音位用清/p/浊/b/对立而不同于汉语普通话的用是否送气来区别。
7.语言节奏:语言的节奏是狭义的节奏,是语流中某些超音段要素在时间上等距离地、周期性地交替出现。相当于音乐节拍但不如音乐规整严格。包括音节(或韵素)型节奏和音步型节奏。
8.成句范畴:语气(陈述、疑问、祈使、感叹)、情态、时、语态等句子功能意义类别。成句范畴有一定的表达形式,例如疑问句语气可以用语调或虚词表达。
9.黏着语:只以黏着语素替换作为表示语法关系的主要手段的语言。例如土耳其语、维吾尔语、芬兰语等。
10.概念结构:词义之间的相互关系叫做一种语言的概念结构,词义的形成以现实现象为基础,同时也受制于本语言词义的相互关系(概念结构)。不同的语言对现实有不同的切分,也就具有不同的概念结构。
11.中心意义:离开上下文后人们最熟悉的意义,它大多同本义一致,有时同本义不一致。中心意义是从多义词在某个时代各义项之间的关系的角度分析出的。例如,单独取出“兵”这个词,一般人首先想到的是“兵士”的意义。
二、相近概念的辨析
1.语言和言语
答:(1)语言是人类最重要的交际工具,是人们进行沟通交流的各种表达符号。言语是说出来的话;说出来的一个词。
(2)语言与言语的区别:
①语言是交际工具,非自由的,组词成句的规则有限;
②言语即说话,运用交际工具,是自由的,创造新句无限。
(3)语言与言语的关系:
①言语是对特定语言的具体运用;例如:他不言语。/ 他的言语和有趣。
②语言存在于各种各样的言语之中;
③没有言语就无所谓语言。
2.音系学和语音学
答:(1)音系学,又称音位学(phonemics),是研究语言的语音系统的一门学科,包括对当代语言的语音系统的分析和对历史语音变化的研究两个方面。后者在中国传统称为音韵学。
语音学(Phonetics)是对人类语言发音进行的研究,它包括建立一套描述语音的方法和体系,也包括与之相关的理论建构,还可以包括由此带来的应用前景。
(2)音系学和语音学的区别:
①语音学从自然属性角度研究人类所有语言的语音发音原理和听觉反应。
②音系学从社会属性角度研究语音在具体系统中的组织方式及其不同作用。
(3)语音学与音系学的联系:
①都关注语音在具体语言系统中的作用。
②音系学研究以语音学的成果为基础。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
语言是人类最重要的交际工具,它存在于人们的运用中。运用中的活语言是社会成员之间联系的重要纽带,它和社会的发展、人群的聚合离散息息相关。
因此,在社会中,语言的运用由于人群、地域、经济、文化、政治等各种因素的影响,必然会产生分化,也就是说,整个人类、一个国家、乃至一个省、市甚至一个小镇的各阶层的人们不可能都运用着统一的语言而没有任何差异。
社会由低级到高级,由简单到复杂,在发展的整个过程中或某个阶段里,势必会分化成不同的社会团体、地域行政区划。同样,语言也会随着社会的分化而产生分化:社会各阶层会产生不同的言语团体,在此基础上就会产生不同的社会方言;各个大小地域行政区划,比如一个省、直辖市、市、县、镇、区甚至一个村都可能使用具有独特言语特色的方言而就产生地域方言以上两种方言是语言的有限分化产生的结果,即在同一种语言里由于社会阶层和地域的不同而使语言产生的分化,是全民语言的分支,这种分化局限于一种语言的范围内。
然而如果由于历史、经济、政治等原因,从同一种语言分化出来几种独立的语言,彼此有同源关系,那么语言的这种绝对分化就产生了亲属语言。
在社会发展过程中,由于生产力水平的不断提高,出现了社会分工,有了不同行业,形成了不同的阶级和阶层,在统一的社会中出现了不同的社会集团,这些集团在长期的言语活动中会形成与自己职业、阶层等相关的言语社团。
不仅如此,同一社会中的人,会由于性别、年龄等因素不同也使人群中产生相关的言语社团。在这些言语社团里,人们之间联系密切,交际频繁,拥有自己特有的一些词汇和语言使用方法,各个社团在全民语言的基础上产生各有自己特点的语言分支或语言变体,就是社会方言。
人们常说的“官腔”“干部腔”“学生腔”,或者老百姓称自己的话是“大白话”等等现象,都是对某一言语社团在语言表达上的一些共同特点的概括,这种“腔”或“话”就是一种社会方言,是社会方言的通俗说法。
因此,在社会中,语言的运用由于人群、地域、经济、文化、政治等各种因素的影响,必然会产生分化,也就是说,整个人类、一个国家、乃至一个省、市甚至一个小镇的各阶层的人们不可能都运用着统一的语言而没有任何差异。
社会由低级到高级,由简单到复杂,在发展的整个过程中或某个阶段里,势必会分化成不同的社会团体、地域行政区划。同样,语言也会随着社会的分化而产生分化:社会各阶层会产生不同的言语团体,在此基础上就会产生不同的社会方言;各个大小地域行政区划,比如一个省、直辖市、市、县、镇、区甚至一个村都可能使用具有独特言语特色的方言而就产生地域方言以上两种方言是语言的有限分化产生的结果,即在同一种语言里由于社会阶层和地域的不同而使语言产生的分化,是全民语言的分支,这种分化局限于一种语言的范围内。
然而如果由于历史、经济、政治等原因,从同一种语言分化出来几种独立的语言,彼此有同源关系,那么语言的这种绝对分化就产生了亲属语言。
在社会发展过程中,由于生产力水平的不断提高,出现了社会分工,有了不同行业,形成了不同的阶级和阶层,在统一的社会中出现了不同的社会集团,这些集团在长期的言语活动中会形成与自己职业、阶层等相关的言语社团。
不仅如此,同一社会中的人,会由于性别、年龄等因素不同也使人群中产生相关的言语社团。在这些言语社团里,人们之间联系密切,交际频繁,拥有自己特有的一些词汇和语言使用方法,各个社团在全民语言的基础上产生各有自己特点的语言分支或语言变体,就是社会方言。
人们常说的“官腔”“干部腔”“学生腔”,或者老百姓称自己的话是“大白话”等等现象,都是对某一言语社团在语言表达上的一些共同特点的概括,这种“腔”或“话”就是一种社会方言,是社会方言的通俗说法。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询