对外汉语教师所需要的语料库
CCL语料库
主要功能特色:
支持复杂检索表达式(比如不相邻关键字查询,指定距离 查询,等等);
支持对标点符号的查询(比如查询“?”可以检索语料库 中所有疑问句);
支持在“结果集”中继续检索;
用户可定制查询结果的显示方式(如左右长度,排序 等);
用户可从网页上下载查询结果(text文件);
......
网址:
http://ccl.pku.edu.cn:8080/ccl_corpus/index_bi.jsp
02
HSK动态作文语料库2.0
新版语料库保留了1.1版的全部语料;检索方式除“一般检索”之外,增加了“特定条件检索”;数据统计增加了可视化图形设计;除检索浏览外,用户还可以对发现的语料录入错误和标注错误进行修改;增加了语料自动下载功能(限500条);增加了“个人工作室”;增加了留言功能。详见语料库“帮助”中的“网站使用说明”。
网址:http://202.112.194.56:8088/hsk/Login
03
语料库在线
由教育部语言文字应用研究所计算语言学研究室研发建设,包括现汉、古汉,资源非常丰富。
网址:http://corpus.zhonghuayuwen.org/
04
BCC语料库
BCC语料库由北京语言大学荀恩东教授团队开发维护,目的是建设全面反映当今社会语言生活的大规模语料库。 目前规模:总字数约 150 亿字,包括:报刊(20 亿)、文学(30 亿)、微博(30 亿)、科技(30亿)、综合(10 亿)和古汉语(20 亿)等多领域语料。 功能:可提供各种类型的检索以及可视化服务。
网址:http://bcc.blcu.edu.cn/
05
现代汉语语料库
“现代汉语语料库”含报纸、博客、网站新闻、文学作品、杂志、口语材料、教材语料等内容,规模近2亿字。提供在线按字符串和分词单位检索的检索功能,支持“正则表达式”。 “现代汉语语料库”在国家社科基金项目“基于国家语委‘通用语料库’之上的汉语义频词库的开发”及厦门大学国家语言资源监测与研究教育教材中心其他课题中得到应用并不断完善。
网址:http://ncl.xmu.edu.cn/shj/jcfccorpus.aspx?id=3
06
全球华语语料库
1、东南亚主要华文媒体语料库 语料库的来源以新加坡、马来西亚和泰国等主流媒体为主,语料时间跨度为2005年到2008年,总共文本数为343978个,约3亿字。已经分词和标注词性。
2、东南亚小学华文教材语料库 以新加坡、马来西亚、菲律宾、印尼、越南的小学华文教材为主。选取了20套、约240本小学华文教材,已经输入电脑,总共约300万字。已经进行自动分词,并标注了词性。
3、东南亚华裔留学生作文语料库 语料库收集了2001年到2010年的留学生作文,大约400万字。
4、东南亚华裔留学生口语语料库 语料库收集了2001年到2010年的留学生口语,大约20万字。
网址:https://huayu.jnu.edu.cn/source.aspx
07
对外汉语教材语料库
“对外汉语教材语料库”来自厦门大学国家语言资源监测与研究教育教材中心的语言监测课题,是关于对外汉语教材的专门性语料库。 核心语料包括12套有代表性的国内对外汉语教材,涵盖长期、短期、口语等方面。对语料做了机器分词和词性标注,精加工版做了人工校对。提供在线字符串和词检索检索功能,支持“正则表达式”。
网址:http://ncl.xmu.edu.cn/shj/jcfccorpus.aspx?id
08
全球汉语中介语语料库
从HSK考试、国内外相关学校教学实况中提取作文、口语语料,面向汉语教学和习得研究的需要进行语料标注。
注:提供资源样本下载,资源解释权属相关开发机构所有,资源在建中。
09
国际汉语教学数据库
由中央民族大学开发,查到有用的学术资源、教学资源,还可以了解到对外汉语圈子里发生的相关动态。
网址:http://tpi.muc.edu.cn/App_Pages/Default.aspx
10
汉字偏误连续性中介语语料库
是在中山大学国际汉语学院院长周小兵教授鼎力支持和率领下建设的,有汉字标注版和汉字语法标注版两个入口。
网址:https://cilc.sysu.edu.cn/
后续发现更好的语料库会继续分享给大家。
姜老师18年下半年证书辅导班直播课
直播回放,随报随听
课程在升级,价格仍亲民
62+小时,只要499元