|
|
新词语问与答:新词语是从哪里挑选出来的http://www.sina.com.cn
2008年04月16日 15:04 新浪教育
3、新词语是从哪里挑选出来的? 新词语的调查语料源自国家语言资源监测语料库(包括平面媒体、有声媒体和网络新闻)2007年的全部语料,共计130多万个文本文件,10亿字次左右,近6亿词次。 平面媒体选择了2007年15种报纸作为调查语料,这15种报纸是(按音序排列):《北京青年报》、《北京日报》、《北京晚报》、《法制日报》、《光明日报》、《广州日报》、《华西都市报》、《今晚报》、《南方周末》、《钱江晚报》、《人民日报》、《深圳特区报》、《羊城晚报》、《扬子晚报》、《中国青年报》。总共90万个文本, 5亿字次。 广播电视语料包括中央电视台、北京电视台、上海电视台、上海东方电视台、天津电视台、重庆电视台、广东电视台、山东电视台、新华电视台九家电视台,中央人民广播电台、北京人民广播电台、天津人民广播电台、山东人民广播电台、深圳人民广播电台五家广播电台的282个栏目的2万多个文本,近1亿字次。 网络媒体语料从所采集的新浪、网易、腾迅、Tom、搜狐等五个网络门户网站2007年全年的新闻语料中,选择了新浪、腾迅两个网站的全部年度新闻语料,共计44万个文本,近4亿字次。
【发表评论 】
不支持Flash
|