语言智能技术发展与语言数据治理技术模式构建

被引:10
作者
张凯
薛嗣媛
周建设
机构
[1] 首都师范大学中国语言智能研究中心
关键词
专利文献分析; 语言智能技术发展; 语言数据治理; 语言数据治理技术模式;
D O I
10.19689/j.cnki.cn10-1361/h.20220403
中图分类号
H002 [语言规划]; TP311.13 [];
学科分类号
030303 ; 0501 ; 050102 ; 1201 ;
摘要
梳理近60年(1960~2019)语言智能技术专利申请文献,可以发现近5年语言智能技术进步显著,预计在未来较长一段时期内仍将处于技术爆发期。当下,语言数据治理的重要性日渐凸显。分析当前智能技术赋能下机器翻译、智能客服、网络舆情监测、多语言资源建设等语言数据热点服务,指出语言数据治理体系面临的技术困境:(1)语言数据的偏见现象;(2)经典语言治理模型的短板。为破解困境并弥补经典数据挖掘模式的短板,提出点状聚合、线性组合和多层事态3种语言数据治理模式并展开对比分析,以期对智能化数据治理提供参考。
引用
收藏
页码:35 / 48
页数:14
相关论文
共 31 条
[1]   主持人语 从数据到语言数据 [J].
李宇明 ;
王春辉 .
语言战略研究, 2022, 7 (04) :13-14
[2]   关于语言文字治理现代化的若干思考 [J].
王春辉 .
语言战略研究, 2020, 5 (06) :29-36
[3]   粤港澳大湾区的四大基本语言建设 [J].
李宇明 ;
王海兰 .
语言战略研究, 2020, 5 (01) :11-21
[4]  
潘云鹤:“人工智能2.0”与数字经济[J] 杭州科技 2019, 05
[5]   基于大数据的汉语表达智能模型及其理论基础 [J].
周建设 ;
彭琰 ;
张跃 .
首都师范大学学报(社会科学版), 2014, (05) :81-85
[6]   古籍数字化概念的形成过程探析 [J].
毛建军 .
科技情报开发与经济, 2006, (22) :160-162
[7]  
语言智能研究渐成热点[N] 周建设;吕学强;史金生;张凯; 中国社会科学报 2017,
[8]  
Social Data: Biases; Methodological Pitfalls; and Ethical Boundaries[J] Olteanu Alexandra;Castillo Carlos;Diaz Fernando;Kıcıman Emre Frontiers in Big Data 2019,
[9]  
A Framework for Understanding Unintended Consequences of Machine Learning.[J] Harini Suresh;John V. Guttag CoRR 2019,
[10]  
中国语言生活状况报告[M] 国家语言文字工作委员会 商务印书馆 2018,