新词语问与答:新词语是从哪里挑选出来的

http://www.sina.com.cn 2008年04月16日 15:04   新浪教育

  3、新词语是从哪里挑选出来的?

  新词语的调查语料源自国家语言资源监测语料库(包括平面媒体、有声媒体和网络新闻)2007年的全部语料,共计130多万个文本文件,10亿字次左右,近6亿词次。

  平面媒体选择了2007年15种报纸作为调查语料,这15种报纸是(按音序排列):《北京青年报》、《北京日报》、《北京晚报》、《法制日报》、《光明日报》、《广州日报》、《华西都市报》、《今晚报》、《南方周末》、《钱江晚报》、《人民日报》、《深圳特区报》、《羊城晚报》、《扬子晚报》、《中国青年报》。总共90万个文本, 5亿字次。

  广播电视语料包括中央电视台、北京电视台、上海电视台、上海东方电视台、天津电视台、重庆电视台、广东电视台、山东电视台、新华电视台九家电视台,中央人民广播电台、北京人民广播电台、天津人民广播电台、山东人民广播电台、深圳人民广播电台五家广播电台的282个栏目的2万多个文本,近1亿字次。

  网络媒体语料从所采集的新浪、网易、腾迅、Tom、搜狐等五个网络门户网站2007年全年的新闻语料中,选择了新浪、腾迅两个网站的全部年度新闻语料,共计44万个文本,近4亿字次。

发表评论 _COUNT_条
点击进入查看更多教育考试的精彩内容~~
Powered By Google
不支持Flash
·《对话城市》直播中国 ·新浪特许频道免责公告 ·诚招合作伙伴 ·企业邮箱畅通无阻
不支持Flash