语料库语言学术语汇编A glossary of corpus linguistics

上传人:ta****u 文档编号:146440718 上传时间:2022-08-31 格式:DOC 页数:8 大小:288KB
收藏 版权申诉 举报 下载
语料库语言学术语汇编A glossary of corpus linguistics_第1页
第1页 / 共8页
语料库语言学术语汇编A glossary of corpus linguistics_第2页
第2页 / 共8页
语料库语言学术语汇编A glossary of corpus linguistics_第3页
第3页 / 共8页
资源描述:

《语料库语言学术语汇编A glossary of corpus linguistics》由会员分享,可在线阅读,更多相关《语料库语言学术语汇编A glossary of corpus linguistics(8页珍藏版)》请在装配图网上搜索。

1、语料库语言学术语汇编(V2.0)Last updated 2012-10-08 by 许家金Aboutness所言之事Absolute frequency绝对频数Alignment (of parallel texts)(平行或对应)语料的对齐Alphanumeric字母数字构成的Annotate标注(动词)Annotated text/corpus标注文本/语料库、赋码文本/语料库Annotation标注(名词)Annotation scheme丄一、亠. 标注万案ANSI/American National Standards Institute美国国家标准学会ASCII/American

2、 Standard Code for InformationExchange美国信息交换标准码Associates (of keywords)(主题词的)联想词AWL/academic word list学术词表Balanced corpus平衡语料库Base list/baselist底表、基础词表Bigram二元组、二元序列、二元结构Bi-text/bitext双语合并文本、双语分行对齐文本 (一句源语一句目标语对齐后的文 本)Bi-hapax两次词Bilingual corpus双语语料库Bootcamp debate/discourse/discussion(新手)训练营大辩论/话语/

3、大探讨CA/Contrastive Analysis对比分析Case-sensitive/case sensitivity大小写敏感、区分大小写Category-based approach基于类(范畴)的方法Chi-square test/ X卡方检验Chunk词块CIA/Contrastive Interlanguage Analysis中介语对比分析CLAWS/Constituent Likelihood AutomaticWord-tagging SystemCLAWS词性赋码系统Clean text policy干净文本原则Cluster词簇、词丛Colligation类联接、类连接

4、、类联结Collocate n./v.搭配词;搭配Collocability搭配强度、搭配力Collocation搭配、词语搭配Collocational strength搭配强度Collocational framework/frame搭配框架Collocational profile搭配概貌Collocational network搭配网络Comparable corpora类比语料库、可比语料库Computational Linguistics计算语言学ConcGram/concgram同现词列、框合结构Concord索引(行)(简略形式)Concordance (line)索引(行)C

5、oncordance plot(索引)词图Concordancer索引工具Concordancing索引分析Context语境、上下文Context word语境词Contextual prosody语境韵律Contingency table连列表、联列表、列连表、列联表Co-occurrence/Co-occurring共现、同现Corpus Linguistics语料库语言学Corpus, pl corpora语料库Corpus-based基于语料库的Corpus-based translation studies基于语料库的翻译研究、语料库翻译 学、基于语料库的译学研究Corpus-dr

6、iven语料库驱动的Corpus-informed语料库指导下的、参考了语料库的Corpus size库容Corpus stylistics语料库文体学Co-select/co-selection/co-selectiveness共选(机制)Co-text共文Data mining数据挖掘DDL/Data Driven Learning数据驱动学习Dependency(句法)依存关系Dice coefficientDice系数Disambiguation消歧Diachronic corpus历时语料库Discourse话语、语篇Discourse prosody话语韵律Documentatio

7、n文检报告、备检文件、说明文档EAGLES/Expert Advisory Groups on Language Engineering StandardsEAGLES文本规格Empirical linguistics实证语言学Empiricism经验主义Encoding字符编码Error-tagging错误标注、错误赋码Explicitation显化Extended unit of meaning扩展意义单位File-based search/concordancing批量检索Firthian (linguistics)弗斯(语言学)、弗斯学派的(语言 学)Formulaic sequenc

8、e程式化序列、套语Frequency频数、频率Frequency list词频表General (purpose) corpus通用语料库Genre语体、体裁Grammatical patterning语法型式Granularity颗粒度Hapax legomenon/hapax一次词Header/corpus head文本头、头标、头文件Hidden Markov model (HMM)隐马尔科夫模型、隐马模型Idiom principle习语原则、成语原则Idiomaticity习语性、地道程度Implicitation隐化Index/indexing(建)索引In-line annota

9、tion文内标注、行内标注Interlanguage中介语、过渡语Inter-coder agreement/reliability标注者间一致性/信度Introspection/introspective内省(式)(的)Intuition直觉Key keywords关键主题词Keyness主体性、关键性Keywords主题词KWIC/Key Word in Context语境中的关键词、语境共现(方式)KWIC sort语境共现排序、索引行排序Learner corpus学习者语料库Lemma, pl lemmata/lemmas词目、原形词、词元Lemmatization词形还原、词元化L

10、emmatizer词形还原工具、词元化工具Lexical bundle词束Lexical density词汇密度Lexical frequency profile词频概貌Lexical grammar词汇语法Lexical item词项、词语项目Lexical patterning词语型式、词汇型式Lexical priming词汇触发理论、词汇启动理论Lexical profile词汇分布概貌Lexical richness词汇丰富度Lexico-grammar词汇语法Lexis词语、词项、词语学Log-likelihood ratio对数似然比、对数似然率Longitudinal/deve

11、lopmental corpus跟踪语料库、发展语料库、历时语料 库Machine-readable机读的Machine translation机器翻译Manual annotation手工标注Markup/mark-up标记、置标MDA (Multi-dimensional analysis/approach)多维度分析法Metadata元信息Meta-metadata兀兀信息MF/MD approach/multi-feature/multi-dimensional analysis多特征/多维度分析法Misuse误用Monitor corpus(动态)监察语料库Monolingual c

12、orpus单语语料库Multilingual corpus多语语料库Multimodal corpus多模态语料库MWU/multiword unit多词单位MWE/multiword expression多词表达MI/mutual information互信息、互现信息N-gramN元组、N元序列、N元结构、N元 词、多词序列Neo-Firth (school)新弗斯学派Neo-Firthian新弗斯学派的NLP/Natural Language Processing自然语言处理Node (word)节点(词)Normalization标准化、(翻译)规范化、泛化Normalized fre

13、quency标准化频率、标称频率、归一频率Observed corpus观察语料库Ontology知识本体、本体Open choice principle开放选择原则OrthographicOrthography正字法Overuse过多使用、超用、使用过度、过度使 用Paradigmatic纵聚合(关系)的Parallel corpus平行语料库、对应语料库Parole linguistics-丁语丁语学 言语语言学Parsed corpus句法标注的语料库、树库Parser句法分析器Parsing句法标注、句法分析Pattern/patterning型式、模式Pattern grammar型

14、式语法Pattern matching模式匹配Pedagogic corpus教学语料库Phraseology短语、短语学Phraseological unit/sequence短语单位/序列Plain text纯文本POSgram赋码序列、码串POS sequence赋码序列、码串POS tagging/Part-of-Speech tagging词性赋码、词性标注、词性附码POS tagger词性赋码器、词性赋码工具Prefab预制语块Probabilistic(基于)概率的、概率性的、盖然的Probabilistic grammar概率语法、概率性语法、盖然语法Probability概率

15、Query查询、检索Range分布(范围)、跨度Rationalism理性主义Raw frequency原始频数、生频数Raw text/corpus生文本/生语料Reference corpus参照语料库Regex/RE/RegExp/regular expressions正则表达式、正则式Register variation语域变异Relative frequency相对频率Representative/representativeness代表性(的)Rule-based基于规则的S-universals源语型共性(特征)Sample n./v.样本;取样、米样、抽样Sampling取样、

16、米样、抽样Sanitization净化Search term检索项Search word检索词Segmentation切分、分词Semantic association语义联想Semantic preference语义倾向、语义趋向Semantic prosody语义韵Sentence alignment句对齐、句级对齐SGML/Standard Generalized Markup Language标准通用标记语言Simplification简化Skipgram跨词序列、跨词结构Span跨距Specialized corpus专用语料库、专门用途语料库、专题 语料库Standardized

17、type/token ratio标准化类符/形符比、标准化类/形比、 标准化型次比Standardized TTR/STTR标准化类符/形符比、标准化类/形比、标准化型次比Stand-off annotation分离式标注Stochastic随机的Stop list停用词表、过滤词表Stop word停用词、过滤词Synchronic corpus共时语料库Syntagmatic横组合(关系)的T scoreT值T-universals目标语型共性(特征)Tag赋码、标记、附码Tagger赋码器、赋码工具、标注工具Tagging赋码、标注、附码Tag sequence赋码序列、码串Tagset

18、赋码集、码集Tertium comparationis对比中立项、对比基础Text文本Text type文体、文类Text category文体、文类Text mining文本挖掘TEI/Text Encoding InitiativeTEI文本编码计划The Lexical Approach词汇中心教学法The Lexical Syllabus词汇大纲Token形符、词次Token definition/word definition形符界定、单词界定Tokenization分词Tokenizer分词工具Transcription转写Translation memory翻译记忆(库)Tran

19、slation norms翻译规范Translation universals/Universal features of translation翻译共性、翻译普遍特征Translational corpus翻译语料库Translationese翻译体、翻译腔Treebank树库Trigram三元组、三元序列、三元结构T-scoreT值Type类符、词种、词型TTR类符/形符比、类/形比、型次比Type/token ratio类符/形符比、类/形比、型次比Underuse少用、使用不足Unicode通用码Unicodify按通用码编码、转换为通用码Unit of meaning意义单位WaC/

20、Web as Corpus网络语料库、网库Wildcard通配符Word alignment词对齐、词级对齐Word form词形Word family词族Word list词表Word sketch词语素描WSD/Word-sense disambiguation词义消歧XML/Extensible Markup Language可扩展标记语言Zipf Law/Zipfian Law齐夫定律Z scoreZ值常用语料库ACEAustralian Corpus of EnglishANCAmerican National CorpusARCHERA Representative Corpus

21、of Historical English RegistersBASEBritish Academic Spoken English CorpusBAWEBritish Academic Written English CorpusBNCBritish National CorpusBoEBank of EnglishBrownBrown CorpusCANCODECambridge and Nottingham Corpus of Discourse in EnglishCECChina English CorpusCEMCorpus for English MajorsCHILDESChi

22、ld Language Data Exchange SystemCICCambridge International CorpusCLECChinese Learners English CorpusCLOB2009 Brown family corpus of British EnglishCOBUILDCollins Birmingham University International Language DatabaseCOCAThe Corpus of Contemporary American EnglishCOLSECCollege Learners Spoken English

23、CorpusCOLTBergen Corpus of London Teenage LanguageCrown2009 Brown family corpus of American EnglishFLOBFreiburg-LOB Corpus of British EnglishFROWNFreiburg-Brown Corpus of American EnglishHelsinkiDiachroniccorpusDiachronic part of the Helsinki Corpus of English TextsHKCSEHong Kong Corpus of Spoken En

24、glishICEInternational Corpus of EnglishICE-GBInternational Corpus of English: Great BritainICLEInternational Corpus of Learner EnglishJEFLLJapanese EFL Learner CorpusLCMCLancaster Corpus Mandarin ChineseLINDSEILouvain International Database of Spoken English InterlanguageLIVACLinguistic Variations i

25、n Chinese Speech CommunitiesLLCLondon Lund CorpusLOBLancaster-Oslo/Bergen CorpusLOCNESSLouvain Corpus of Native English EssaysLONGDALELONGitudinal DAtabase of Learner EnglishMICASEMichigan Corpus of Academic Spoken EnglishMICUSPMichigan Corpus of Upper-level Student PapersNESSIENative English Speake

26、rs Similarly and Identically-promptedEssaysPACCELParallel Corpus of Chinese EFL LearnersSBCSAESanta Barbara Corpus of Spoken American EnglishSCCSDThe Spoken Chinese Corpus of Situated DiscourseSCORESingapore Corpus of Research in EducationSECSpoken English CorpusSECCLSpoken English Corpus of Chinese LearnersSECOPETSSpoken English Corpus of Public English Test SystemSEUSurvey of English UsageSWECCLSpoken and Written English Corpus of Chinese LearnersWECCLWritten English Corpus of Chinese LearnersLast updated 2012-08-08 by 许家金

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!