免费论文查重: 大雅 万方 维普 turnitin paperpass

分析语料库基于网络语料库WebCorp话语历史

最后更新时间:2024-04-07 作者:用户投稿原创标记本站原创 点赞:14474 浏览:60141
论文导读:
摘要:本文将运用网络语料库webcorp针对中国形象进行批评性话语分析。此分析采用话语,历史分析方法,通过其三个阶段:①给特定话语建立主要主题;②研究所使用的话语策略;③检查话语策略的语言学方法和实现,来探索网络语料库在批评性话语分析中的应用。
关键词:话语历史分析;网络语料库;WebCorp
1001-5795(2012)09-0031-0005
作者简介:黄晓英:女,博士,副教授。研究方向:话语分析,外语教学与研究。
杨跃:男,教授。研究方向:英语教学及科技英语翻译研究。
收稿日期:2011-08-10
基金项目:教育部人文社科研究项目基金资助(项目编号:09XJC740006)基于国际政治新闻英语库的批评性话语分析。
1.引言
1999年网络作为语料库出现在ACL的大会上,Kalgarriff和Grefenstetle向人们展示了网络作为语料库的用途。它以其巨大的文本资料库为研究者们提供了很多的机会,通过鼠标点击就能得到数千亿的文字文本,如今语言科学家和技术人员越来越多地转向作为语言数据源的Web,不仅因为它是如此之大,而且因为它有各种形式的、免费的、可以立即使用的语言。最简单的语言研究应用是拼写检查,如Speculater还是speculator?谷歌给出前者的搜索结果是67个,后者是82000个。这就是說,从互联网上通过鼠标点击文本可以提取很多的数据,这不是“传统”的对比研究所能比拟的。可以說,著名的语料库和万维网作为数据源清楚地表明,互联网提供了一个比其他知名的文本集合更多的数量。尤其是当涉及频繁的字或词的组合时,会有更多的证据数据,研究者通过互联网可以获得与更稳定的结论有关的语言文本。
对语言学家来說网络不仅仅是进行信息检索和交流的工具,而且还是一个真实数据的巨大资源库,也是一个自我更新的语言资源库,能够提供一个在新鲜度和时效性上其它媒介无法比拟的语料库。软件开发使万维网的巨大的语言数据更易消化和研究,这给学者、教师和学生带来了极大的方便。迄今为止,大部分语言研究者所描述的语言使用的信息网络是以语言语法或說教为目的,很少进行有关的批评性话语分析。批评话语分析是做社会的相关研究,它不愿完全接受网络上出现的内容,于是很少向网络寻求其主要数据。但是如今出现在网络上的社会内容具有了普遍性、可靠性和代表性,批评性话语分析也对网络上的内容表现出极大的关注。本文将运用网络语料库webcorp针对中国形象进行批评性话语分析,以此探索网络语料库在批评性话语分析中的应用。

2.文献研究

自90年代中期互联网盛行以来,出现针对在网络上进行各种沟通形式的研究,这包括了以计算机为媒体的各种通信方式、符号文本的互动的各个实体研究,尤其是超文本方面的研究,在线社会网络研究,以及这些方式对教学和学习带来的影响。这些理论方法对基于网络交流的研究从话语分析到社会学的批评理论都有影响,互联网的确受到来自不同学科,包括话语分析的关注,但通常是具有独特的符号学潜力或“适宜性”的媒介才是人们关注的焦点。现在有相当大数量的文章调查网络在论文导读:
语言学研究方面的潜力,同时引进或评估软件工具和进行样本分析,如Fletcher(2001)等人。这方面的研究工作一般都是来自于语料库语言学。
基于网络数据的批评性话语分析研究并没有像人们所期望地一样多,人们通常认为批评性话语分析“就是把话语看成社会实践的形式”和“有社会影响力的分析语言和符号学方面的社会进程和问题的事物”(Fairclough&Wodak,1997:271)。最近的一些相关期刊问题调查显示,1998-2004年间的Discourse and Society以及2002-2004年间的Social Linguistics中采用网络数据对于话语和文字进行批评性话语分析研究,常用的仍是原来传统渠道,以报纸和杂志为主体,兼有其他印刷和广播媒体。国外批评性话语分析的标准数据组合仍然停留在非电子通讯文本上。

3.网络语料库的工具

网络语料库有两层意义,web as corpus和web for corpus(Kilgaarriff)。一是指通过工具直接运用网络来做语料库,比源于:毕业设计论文格式www.7ctime.com
如通过Google等互联网搜索引擎来进行检索并统计。当然,也有些运用网络语料的项目是在搜索引擎的基础上添加对结果进行处理的界面,让检索结果和索引工具具有类似的呈现方式,比如,关键词居中、检索结果按字母顺序重排等等。曼切斯特大学的WebCorp和Leeds大学的Internet corpora就是这方面很好的例子。
本文主要是针对是WebCorp的研究,WebCorp虽然是一个随机语料库,但它所提供的对域的选择应该能给我们很好的帮助。它是一个功能很强大的网络语料库,它以Google等搜索引擎的搜索结果为基础,其界面如图1所示。
我们可以看到这是一个产生基于网络的语词的非常有用的和简单的工具,它也提供了高级搜索选项,用户可以设置自己的搜索条件,如:可以用指定的互联网网站,选择一些报纸领域提供的,可以选择一个特定的主题领域,并进行其他设置,也可以选择自己希望的数据的时间范围和有关的出版日期。
为了方便语言研究,WebCorp还提供了语言学的研究搜索引擎,如图2所示。
从图2我们可以看到,这个网络语料库不仅提供了共时的网络语料库,还有历时的网络语料库。有些网络语料库的语料无法选择,而且不清楚语料来源,而WebCorp由于有了专供学术研究使用的搜索,它的语言研究很好地避免了这一点。

4.研究与分析

21世纪以来,中国的快速发展令不少国家钦佩,也令有些国家紧张。此间网络上有关中国的报道是世界公众了解中国的一个窗口,事关中国的国际形象,会影响到中国的国际地位和对外关系。网络的速度快、覆盖范围广,对国际事务的报道和研究深度是其他媒体无法比拟的,正在成为塑造国家形象的主要载体。所以本项研究就“中国形象”通过网络语料库中出现的数据进行批评性话语分析研究,具有现实和理论意义。本文对批评性话语分析采取话语,历史方法,可以简单定义它为分析框架,它将话语看作是社会行为(比如,话语执行社会行为),并且调查文本、意识和权力之间的方言关系(Wodak,2001;Wodak&Meyer,2009)。该特殊方法适用于本研究目的,因为它关注于政治领域(Wodak&Meyer,2009:26),其中包含了政治独立这一话题。话语,历史分析包括以下三个阶段:①给特定话语建立主要主题;②研究所使用的话语策略;③检查话语策略的语言学方法和实现(Reisigl&Wodak,2009:93)。源于:论文范文格式www.7ctime.com