免费论文查重: 大雅 万方 维普 turnitin paperpass

试析大数据时代传播中语料库方法价值

最后更新时间:2024-02-11 作者:用户投稿原创标记本站原创 点赞:16522 浏览:71091
论文导读:
摘要:大数据时代的研究逻辑,对传播学研究形成了新的冲击,传统的文本分析策略,已经不能满足对样本数量的宏阔和数据挖掘深度上的双重要求。语料库的研究策略在数据新闻、舆情监测和学术研究等领域都可以得到广泛的应用。通过语料库这种结构化的文本数据来开展的量化研究,在国内外新闻传播学界都属新鲜待开发的领域。
关键词:大数据 语料库 文本数据 语义挖掘 定量研究
在新闻传播学视野之下,大数据的分析思维正在对我们的研究形成冲击,比如新闻业务将实现一些方向性调整,趋势预测性新闻和数据驱动型深度报道分量增加。对于舆情研究来说,问卷发放和小组访谈等传统的民意调查策略,已经不能满足基于社交媒体平台的海量信息处理要求。新闻传播学领域的研究面对一个共同理由,即文本分析策略的创新。基于大数据的分析思维,文本也是一种有巨大潜在价值的数据。但是传统的文本分析手段拘泥于有限的样本数量和定性研究的窠臼,无法满足大数据时代对内容挖掘上广度和深度的要求。在这种情况下,来源于应用语言学领域的语料库分析策略的介入,能够使结构化文本数据库的构建成为可能。再结合语言学、修辞学领域的内容分析手段,能为我们从研究范式到研究策略、工具上都提供一些新思路。

一、大数据时代对新闻传播学研究范式提出的新课题

(一)新闻实践领域

随着社交媒体的应用和智能手机的普及,人人都可以是事件的目击者和发布者,传统媒体新闻报道在原创性和独家性方面的优势已不复存在。大众传媒作为社会的记录者与传播者的传统定位及面向所有受众的粗放式信息传播方式,已越来越不能满足受众对于精准信息和内容的需求。
大数据时代,最重要的是数据的开放性,其被垄断的可能性很小,公共云、公共数据库到处存在。媒体既要生产自己的数据,更要会用、用好公共数据。这些公共数据不仅包括数字信息,也包括大量文本内容。要使用这些公共内容,就需要有对海量信息的整合能力以及对潜在信息价值的挖掘能力,并需用可视化工具把结果精准地呈现出来。

(二)舆情研究领域

在研究视角上,传统的舆情研究大都局限于比较表层化的话语研究和事件研究,没有深入挖掘公众的思想、行为和情感方面丰富的内涵和规律性信息。而且受传统的调查、访谈策略自身的局限性影响,很难进行受众心理图谱、行为图谱和社会关系图谱这样复杂的语义关系的绘制和分析。
在研究时距上,目前的舆情研究以共时性研究为主,历时性研究缺乏。但是,舆情热点的变化具有年轮效应,只有横向的共时性分析是不够充分的,没有对公众舆论的历时l生演变和舆情发生机制的纵向研究,我们在认识和行动上的方位感就会不够客观和真实。
在采集策略上,现有的舆情监测和分析软件的同质化程度较高,采集的文本大多是基于互联网社交媒体,分析结果的呈现方式也比较相似。在炫目的可视化图景背后,没有对文本数据的深度分析,而这种深度分析要基于对大量文本的内容挖掘和整合,这就需要经过结构化处理的文本数据库来支持。舆情话语的表达乱象纷繁,真伪并存,既需要小型的基础文本数据库来深度挖掘某类热点专题,也需要大型合成文本数据库对舆论走向和趋势进行宏观把握。

(三)传播学学术研究领域

传统的传播学文本分析,主要以框架分析、符号分析等定性分析策略为主,但这两种分析主要集中于意识形态、修辞方式等方面,不够客观。而文本内容,特别是舆论研究的文本内容,有零散化、碎片化的特征,在拉斯韦尔的5W里面,say what(文本内容研究)的理由常常被人忽略。虽然有一些专门的词频统计分析软件,可以完成对高频词和低频词的统计分析,但在语义深度挖掘方面仍然有待开发。我们需要找到一种常规的工具,可以把学术文本进行结构化策略上的整合,通过把文本分类、合并,提取常用关键词和核心词,按研究主题分门别类地进行储存,为对比研究、专题研究等领域提供更加严谨和结构化的文本数据库支持。

二、语料库分析:体现大数据思维的研究策略

语料库属于应用语言学的范畴,是指按照一定的语言学原则,运用随机抽样策略,收集自然出现的连续语言运用文本或话语片段而建成的、具有一定容量的大型电子文本库。该策略在国外已有三十年以上的研究历史,如今也拥有较为成熟的语料库构建与检索工具,比如Wordith、AntConc等。国内语料库的研究亦开展近二十年时间,研究范畴基本被划分为词汇、语法、语篇、语用和文体研究等五个方面。利用语料库作为研究工具,可以从微观层面对新大数据时代传播中语料库方法的价值由优秀论文网站www.7ctime.com提供,助您写好论文.闻传播学领域的文本内容进行研究。在语言学领域,语料库的研究策略已日趋成熟,只不过尚未走进新闻传播学的视野,这是因为新闻传播学在文本内容分析方面欠缺新的策略,需要语料库这类研究策略的介入。

三、语料库研究策略的应用领域

(一)在新闻实践领域的应用

1.史料检索语料库。即把新闻报道的原创内容和历史资料数据化,变成媒体的核心资产。在新闻传播渠道日益扁平化的今天,建立一个受众易于发现和易于使用的史料数据库,是报纸存活下去的核心竞争力之一。另外还可以采集一些外部数据来作为语料库的扩充部分,如通过合作、购买、交换、抓取等方式来获取来自其他媒体的内容和来自互联网平台用户创造的内容,并完善语料库的资料存储、检索查询和版权管理,为进一步转化利用打好基础。
2.政府公开信息语料库。彭博社亚洲区新闻资讯主编Lee Miller指出:数据驱动型报道中的数据都可以并且应该从公开信息渠道中获得。所谓的信源和数据,并不一定要像“维基解密”或斯诺登那样从秘密渠道获取,而是应该从公开信息中挖掘。这些信源包括政府机构网站中日常发布的政策信息和每年重大会议的政府工作报告;大众媒体网站上的报道和专题;媒体的新媒体移动终端发布的内容等等。根据政治、经济、教育、公共卫生等不同主题,建立可供随时检索的公开信息语料库,能够为媒体报道节约大量搜寻数据和素材的人力和物力。大数据时代传播中语料库方法的价值相关范文由写论文的好帮手{#GetFullDomain}提供,转载请保留. 全文地址:www.7ctime.com/shcbxlw/lw40871.html上一论文:试谈说岳戏曲传播概论