论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>职称论文>范文阅读
快捷分类: 通信系统论文 论文推荐 信息系统项目管理论文 旅游杂志推荐 小学生期刊推荐 论文查询系统 电子商务推荐系统论文 开题报告推荐系统 推荐系统论文 推荐系统文献综述 单片机入门系统的开题报告89s51 会计信息系统参考文献

推荐系统方面有关论文范文 与新闻推荐系统中的信息茧房问题:议题综述和解决思路相关自考毕业论文范文

分类:职称论文 原创主题:推荐系统论文 发表时间: 2024-02-26

新闻推荐系统中的信息茧房问题:议题综述和解决思路,本文是关于推荐系统相关论文范文跟议题综述和茧和信息茧房问题有关专科开题报告范文.

1 研究缘起与概念界定

1.1 研究缘起

通过算法完成资讯的个性化推荐和分发,正成为今天新闻业内越来越多媒体的选择.无论是技术出身的内容推荐引擎“今日头条”“一点资讯”、Z*ER 等,还是传统媒体出身的四川报业集团与阿里巴巴合作推出的“封面新闻”、门户网站的移动端应用“腾讯新闻”等,都将信息的“个性化推荐”作为自己的产品亮点.个性化推荐是一种信息过滤技术,“个性化”是其技术目的,推荐算法是其方法.它期望通过分析大量用户行为日志,给不同用户提供不同的个性化页面展示,来提高网站的点击率和转化率[1]4.它在不同产品中的应用已由来已久.电子商务领域有亚马逊被RWW(读写网)称为“推荐系统之王”.影视领域有美国视频公司Netflix 为了更精准地对用户进行电影推荐,自2006 年起开始举办著名的Netflix Prize 推荐系统比赛,悬赏百万美元,希望将算法的预测准确度提升10%.

在信息阅读领域,“今日头条”是于“GoogleReader”“鲜果网”等阅读工具开发的后继实践者.它从2013 到2015 年间异军突起,迅速占取国内大量网络新闻受众,也在2017 年到2018 年来遭遇数次公众舆论质疑.2017 年9 月,人民日报连续发表3 篇文章就算法推荐问题质问“今日头条”过度依赖技术导致用户受困“信息茧房”.2018 年1 月,其陷入“麦克风事件”.众多网友质疑“今日头条”开启了手机麦克风权限收集用户声音信息进行内容推荐,之后“今日头条”回应表示其技术达不到也不会去进行这样的信息收集.尽管“今日头条”做出了澄清,网友的质疑则侧面表现出人们对于被自己的浏览历史、社交足迹“包裹”的恐慌.

这种“被包裹”的恐慌,是美国学者桑斯坦在其2006 年出版的著作《信息乌托邦——众人如何生产知识》一书中提出“信息茧房”(InformationCocoons)概念的现实诠释.书中他所描述“信息茧房”由“个人日报”形式呈现.人们可以借助网络平台和技术工具在海量的信息中随意选择自己关注的话题,完全根据自己的喜好报纸和杂志,即一种完全个人化的阅读[2].同时桑斯坦指出,在信息传播中,因公众自身的信息需求并非全方位的,公众只注意自己选择的东西和使自己愉悦的通讯领域,久而久之,会将自身桎梏于像蚕茧一般的“茧房”中.

桑斯坦对此概念阐述的主体是用户,侧重描述基于用户选择的阅读个性化.而推荐系统的设计意图描述则更侧重信息分发者针对用户个体进行的点对点的传播个性化.

但这两层含义并不是相对立的关系,而是存在叠合的交集,这是因为推荐系统个性化传播决策的执行极大依赖着基于用户浏览行为的日志数据.这一点将会结合新闻在推荐系统情境中“创作,发布/抓取,分发/ 点击,阅读”传播的流程模型详述.

本文希望将此模型图作为本次多学科文献梳理的总结,并针对模型图的3 个环节,提出在内容筛选、技术创新、心理考察3 个角度上的应对思路,推动新闻推荐系统“信息茧房”问题的解决.

1.2 主要概念与辨析

1)新闻:本文中指广义上的信息资源,包括文字、图片、视频、问答、直播等不同的形式.新闻推荐系统中,前台展示的新闻主要是来源于网络爬虫、合作媒体和自媒体创作[3].网络爬虫爬取社交媒体、门户网站等信息资源;合作媒体指、省级、各地市、县级及以下媒体;自媒体创作主要提供专业学习信息、新闻、生活休闲类等其他“长尾”信息资源.

2)算法:是一系列解决问题的清晰指令,也可抽象理解为解决问题的方法.理解算法的概念可以从理论与应用层面展开.以推荐算法为例,CF、CBF、DNN 算法等属于理论层面的数学方法,而亚马逊、Youtube、Facebook、今日头条等产品属于算法在应用层面的实践成果,包含商业逻辑在内的复杂运作.

3)推荐系统与推荐算法:Resnick 等于1997年给出了推荐系统的定义.一个完整的推荐系统由用户模型、产品模型与推荐算法三部分组成[4].推荐系统包含推荐算法作为其核心组成部分,同时需要对所推荐的物品和用户建模.对于一个推荐系统来说,推荐算法决定其类型及性能优劣.目前主流的推荐算法有:协同过滤(CF)、基于关联规则的推荐、基于二部图的推荐等[5].

2 关于新闻推荐系统“信息茧房”的主要议题梳理

中文文献的参阅依循各文献之间的引文网络,在CNKI 中选取以下相关关键字按学科分组、以“主题”为搜索条件,选取本世纪至今(2001—2018)被引较多或影响因子较高的文献进行梳理.选取学科分组:新闻与传媒、图书情报与数字图书馆、计算机软件及计算机应用.

主要使用的关键字包括:“信息茧房”“信息窄化”“群体极化”“回音室效应”“个性化推荐”等.涉及其他关键字包括:“推荐算法”“社会化推荐系统”“信息偶遇”等.

英文文献搜索中,在web of science 平台中使用关键字Echo chamber 在SSCI 索引下搜索,从2001 年至2018 年3 月3 日,共得到106 条文献.

2.1 新闻推荐系统“信息茧房”问题背景:还未尽善的技术与大众心理的共谋

概念的提出者桑斯坦将“信息茧房”的产生背景定义在网络与技术环境中.首先从计算机科学与应用的视角下看,推荐系统是为了解决信息过载问题而发展出的一套技术.

纵观因特网的发展源流,它由单个网络ARPANET 升级到现今多层次ISP 结构的互联网,这代表着更复杂的网络层级和更大的用户覆盖面,带来了更多的信息生产和更快的信息交互.为了解决信息过载问题,提升人们获取信息的效率与质量,分类目录、搜索引擎、推荐系统、智能问答等技术应运而生.在具体新闻场景的应用中,相应地出现了以雅虎为代表的门户网站、以谷歌为代表的搜索引擎、以Facebook 上的Neweed、今日头条等为代表的内容智能分发工具和Quartz、微软小冰等对话式新闻产品.

新闻推荐系统在对搜索引擎中PageRank 等经典排序算法的继承和改造的基础上,它的特点在于不需要用户表达明确的特定信息需求.不同于搜索引擎被动等待用户的“搜索”操作,进行信息呈现,推荐算法能够主动收集用户的特征信息.但由于用户没有显式地提出特定信息需求,新闻推荐系统就必须做到挖掘用户的潜在需求,这也使“精确度”成为其系统优劣的首要评价指标,为“信息茧房”问题埋下隐忧.

在计算机界,早在2006 年就有学者意识到在推荐系统仅关注精确性远远不够,可能会导致用户得到一些信息量为零的“精准推荐”,导致视野越来越狭窄的情况[6].这种“越推越窄”的情况被称之为计算机界的探索利用问题,有时也称为EE 问题(Explore & Exploit).2011 年,在ACM 组织的第五届推荐系统国际会议上,专门召开了一个讨论推荐系统多样性的研讨会(DiveES 2011).此后,2013 年国内学界推出第一篇系统地对推荐系统多样性进行综述的文章[7],在分析多样性类型的基础上,重点概括、比较和分析了信息物理、二次优化、社会化网络和时间感知四种提高个性化推荐多样性的方法,期待未来更多算法的有效组合研究.此后,计算机学业界将研究重心转移到推荐系统信息窄化的解决,即推荐算法的优化与更多指标的测试中.例如在发现用户新兴趣上,基于关联规则的推荐优于基于内容的推荐和协同过滤推荐[5].在测试指标设置上,学者项亮总结出包括准确率、覆盖率、多样性、新颖性、惊喜度、信任度等10 余个推荐系统评价指标[1]23-33.另有一批学者的研究成果发表在《复杂网络观察》《复杂系统与复杂性科学》等专业刊物上.

新闻传播学界在“信息茧房”概念提出后也很快加入讨论.学者程士安等以科技进步与传播规律的演进为视角,考察数字化时代的组织传播理论时,对“信息茧房”的概念进行了组织传播视角的重新阐述.提出通过分析新技术条件下的信息聚合与社群的构成,看新技术条件下网络组织微观关系下的“纽带”与“锁扣”特征.对于基本的网络结构“结点与边”(verges and edges),并不局限将“结点”看作单一用户,而是聚合着某同类信息需求的人群,而“边”既是信息聚合体内部的构成纽带,也在外部连接着组织与组织,社群与社群.这使“信息茧房”的研究视域从个人的茧房,扩大到群体的茧房.接着,文章从动态的传播视角,提出了“茧房的迁移”.指小“茧房”通过网络游移,相似的几个子“茧房”会在一个特定大“茧房”平台上达成共识[8].文章从组织传播和网络传播的视角微观、动态地描述了茧房形成与变化的机理;对茧房之内、之间联系的研究,将网络作为基本数据结构之一所定义中物理性质的“边”,融入了社会心理因素的考察.这一观点的提出,也进一步明确了“信息茧房”与“群体极化”等议题之间的紧密联系.

在技术之外,新闻传播界的研究着重指出了“信息茧房”形成在思想渊源、心理特性等方面的原因.2013 年,新闻界期刊首先将此定义正式介绍到国内时,学者梁锋指出“信息茧房”的思想渊源可以追溯到19 世纪初法国思想家托克维尔发现的,社会天然地易于促成个人主义的生成,并随着身份平等的推广而扩散[9].学者刘华栋基于对社交媒体的观察,认为个人兴趣引导人们的信息接收行为使其陷入“信息茧房”,而社交媒体使用进一步促进“信息茧房”的形成[10].学者陈昌凤等认为信息茧房、信息偏向等问题的产生与人们的“证实性偏见”有关[11],即人们倾向于寻找信息确认自己的观点.新闻传播界往往在分析原因后提出关于“信息茧房”危害的议题探讨,网络是信息自由传扬的乌托邦抑或滋养极端意见分子的温床,“信息茧房”与“群体极化”等社会政治议题有何关联,这是此后新闻传播学界的一个研究方向,并综合运用了基于案例观察的或实验设计等实证研究方法,将在本节下一小点再做介绍.

情报管理学界对新闻推荐系统“信息茧房”问题机制的研究起步较晚,2018 年1 月出版首篇网络信息系统视角下的机制研究论文[3].首先从内容智能分发平台信息资源组织方式、信息受众用户行为与信息运动方式三方面分析影响平台信息运动效率的因素.在此基础上探讨“信息茧房”的形成机制时,创新地使用了运动规律、平台情境两个视角.总的来看,新闻推荐系统“信息茧房”问题的出现,从技术发展的脉络来看,是推荐系统完善过程中必然面对的难题,而动态的网络信息空间环境、复杂的个人与群体心理等因素丰富了它可归因的维度,使得这一问题不应仅仅作为技术带来个人视野的局限看待,同时奠基其他群体性社会议题的产生.2.2 新闻推荐系统“信息茧房”认识现状:趋于关注细节、量化的实证研究,总结从个体到社会的多层次危害分析思路

“信息茧房”问题提出后,计算机学界转入问题解决领域进行算法优化研究.目前关于“信息茧房”现状的认识主要来源于新闻传播学界.为丰富研究素材的维度,笔者引入国外SSCI 相关文献的计量分析与阅读梳理,总结得到主要关于“茧房”程度、“茧房”危害两个研究角度.

国内新闻传播学者在考量新闻推荐系统“信息茧房”问题时,常联系“个性化推荐”“算法分发”“智能分发”“算法新闻”等关键词,应用新闻推荐系统的典型产品“今日头条”是主要的研究对象.由于大部分社交媒体在信息推送设计(feed 流)中也多使用到推荐系统技术,也有学者关注社交媒体上“信息茧房”问题.从研究方法上看,国内针对“信息茧房”是否存在以及存在的程度如何的量化实证研究还比较少,多是基于案例观察的质化分析.

学者王茜以“今日头条”为研究对象,运用内容分析法,通过分析77 位用户的8 000 多条新闻推送,发现14% 的参与者收到的单一新闻类型占比超过50%[12],认为其中存在信息窄化问题.学者王秋旭观察微博上作为意见领袖的大V 或公众*,其粉丝会自发性地形成一个团体,这个团体认同意见领袖的言论,由此形成了一种“群体共识”[13].对国外SSCI 论文,以“echo chamber”做关键字进行文献计量分析,从分析结果来看,传播学者们对这一问题的关注度逐年上升(图1).除echo chamber 外,关键词还包括social media,polarization,Twitter,Facebook,climatechange 等( 图2); 拓展关键词包括media,polarization,networks,selective exposure,information,online,internet,communication,news,participation 等( 图3).其中拓展关键词feather 的词频也较高,多以词组birds of afeather(人以群分物以类聚)出现.

对这些字词进行分类可以看出,国外对这一问题的主要研究对象是Twitter,Facebook 等社交媒体、美总统选举等事件,理论视角包括群体极化、选择、公众舆论等.

考虑到推荐系统与搜索引擎、社交媒体的技术渊源,笔者主要选择包含online search,socialmedia,Facebook,Twitter 的相关论文进行介绍.

图1 以echo chamber 为关键词检索得到的SSCI 文献数量历年变化

图2 以echo chamber为关键词检索得到的SSCI文献关键词历年变化

图3 以echo chamber为关键词检索得到的SSCI文献扩展关键词历年变化

在对新闻推荐系统“ 信息茧房” 的存在认定上,学者们意见不一,一些学者会在措辞中加入hypothesis( 假设) 再对其进行实证研究.F.J.Z.Borgesius 等人研究网站利用个性化算法为用户筛选、推送个性化内容,综合运用量化手段分析后认为,目前还缺乏足够的证据表明个性化算法会造成“信息茧房”或“过滤气泡”[14].而DidGoldie 等人使用文献计量方法并针对社交媒体上教育政策辩论的进行研究,认为其中存在“回音室效应”,即通过不断推动小样本量、不具代表性的言论,也会对政策提出产生影响[15].

在考察“信息茧房”存在程度时,来自MIT的学者Sagit Bar-Gill 等认为个体会由于其在网络中的不同角色在“茧房”存在的程度上存在差异.学者们运用实验法,构建了名为TED-it 的在线搜索环境,用户可以通过主题(topic)或流行度(popularity)两个搜索维度观看TED 视频.学者们在2017 年3 月[16] 与8 月[17] 分别发布两次报告,研究发现高社交程度、重复先前相似内容的、年轻(在8 月发布的报告中补充了关于年龄的要素)阅读者容易陷入“信息茧房”.流行的信息提高了意见领袖们的搜索排序,但并没有拓展“非意见领袖”的信息接触面.

在逐渐积累关注细节、量化的实证研究后,传播学者们总结出新闻推荐系统“信息茧房”从个体到社会的多层次危害分析思路.在个体层面,美国学者Kathryn Jemison 和Joseph Capela 在著作《回声室效应:拉什·林博和保守主义媒体的建设》中定义“回音室效应”为,在媒体营造的相对较为封闭的意见感知环境中,意见相近的声音会被不断地重复、夸张和扭曲,从而让处于这个封闭环境中的人对这些夸张和扭曲的极端观点越来越深信不疑的现代传播学现象[18].群体层面,国内传播学者梁锋、喻国明、陈昌凤、刘华栋等学者结合对桑斯坦《信息乌托邦》《网络共和国》等著作的提炼,阐述了“信息茧房”从个体封闭走到群体极化的后果.群体极化是指群体意见中某些既有的偏向,经过商讨以后,群体成员继续沿着偏向的路线前进,最后形成极端的观点.”[19]《“信息茧房”对网络公共领域建构的破坏》一文描述“信息茧房”的危害体现在“‘意见自由表达’受阻、群体极化造成公众理性批判的缺失、社会黏性削弱及破坏共同体维系”[20],也是从这3 个层面做出的总结.

总的来看,对“信息茧房”存在程度甚至是否存在还存在争议,还需更多关注细节、量化的实证研究进行完善.国内传播学者量化成果较少,王茜关于今日头条的量化研究受样本数量制约,其难点之一在于缺乏相关的公开、真实、足够数据量的数据集进行研究使用.倘若收集得到真实用户的匿名行为数据集,就可参照计算传播学研究范式,进行诸如学者王成军利用Digg 社区数据集,对新闻在注意力场中的“逃逸”问题[21] 所做的结合用户行为模拟并进行模型曲线拟合的数理性实证研究.难点之二在于新闻学研究者目前对于网络科学的理论(如同质化理论、资源依赖理论、社会影响理论)的使用依然有限[22],而学科间还未产生广泛交流与讨论.

3 新闻在推荐系统情境中三个环节传播的流程模型及针对性建议

在对新闻推荐系统进行了背景与现状综述的基础上,笔者受上述学科视角启发,构建新闻在推荐系统情境中包含信息流和数据流的“创作,发布/抓取,分发/ 点击,阅读”传播流程模型(图4).这一模型指出了用户“阅读个性化”与新闻推荐系统“传播个性化”之间的关系,并进一步解释了“信息茧房”问题在现有技术条件下的必然和可能的突破环节.

图4 新闻在推荐系统中的数据流与信息流流程模型

如图4 所示,新闻推荐系统中存在信息流与数据流两个信息运动方向.笔者将新闻推荐系统内的6 个典型行为“创作,发布/ 抓取,分发/ 点击,阅读”划分为3 个环节.

从信息流向来看,新闻信息从作为原始传者的内容生产者发布到数字媒体平台上,作为*传者的新闻推荐系统抓取并推送给受众阅读.

从数据流向来看,作为原始传者的内容生产者创作、发布内容,其发布的新闻作为D1(数据源1)被推荐系统抓取,处理为产品模型M1.作为受者的用户对推荐系统前台(所浏览的新闻网页等)执行点击行为,对新闻信息执行阅读行为.其中,前一个行为产生的用户行为日志作为D2(数据源2)被处理为用户模型M2.推荐系统因而扮演着二者之间的*角色,推荐算法通过机器学习,不断优化决策,以达到个性化的推荐决策.举例来说,Youtube 推荐算法①包含两个机器学习目标,第一个是生成候选集,以用户观看历史为输入,使用协同过滤等技术在数以万计的视频中进行选择;第二个神经网络则用于对视频们进行排序,使用逻辑回归计算每个视频得分,然后不断使用A/B 测试进行改进.

通过这两组信息运动流向的比较中可以发现,用户“阅读个性化”与新闻推荐系统“传播个性化”之间,是通过用户“点击”的数据流输入新闻推荐系统,推荐系统基于此进行机器学习将个性化信息流输出给用户,达到了“传播个性化”.因此,用户接受的个性化信息的质量一部分取决于原始传者,即内容生产者,另一部分很大程度上取决于作为*传者的推荐系统.在*环节,推荐算法在用户物品关系矩阵中攫取有效信息反过来填充这个矩阵,这是一个正向自我强化过程,越走越窄是宿命①.如果系统只对探测到的用户兴趣进行“开采利用”,而不发现新的用户兴趣,将无可避免地走向“信息茧房”.

虽然计算机学界已经提出在推荐算法的设计中从“开采利用”向“探索利用”优化,但在目前仍处在研究的初期.包含3 个环节的传播流程图启发我们,解决新闻推荐系统“信息茧房”问题,也可关注其与内容生产方、与用户之间的信息互动.在与内容的洽接环节,提高内容的广度与质量.目前应用新闻推荐系统的媒体主要包含3 类:门户网站的移动端应用“腾讯新闻”等、内容推荐引擎“今日头条”“一点资讯”等、包含“Neweed”(信息流推送)的社交媒体“Facebook”“微博”等.而这些媒体对于合作媒体、自媒体、社交主页等信息资源的采纳权重不尽相同.自媒体信息质量良莠不齐,在消息审核上仍存盲区,提高新闻数据库的准入机制,加强与有宏观视野、专业素养和社会公信力的媒体合作,是提高新闻客观真实性、统括来自不同领域、不同阶层、不同利益群体的立场和态度的有效举措.

需要注意的是,在内容准入审核时不应局限文本信息.随着融合媒体的发展,短视频、直播、互动问答等多样化的形式正在进入分发平台的融合媒体内容端口,成为未来内容审核新的挑战.

在于用户间的信息互动环节,应重视用户心理的自省,发掘其自主能动性.例如开发新闻推荐系统的阅读历史可视化插件,在原有传播流程的基础上,增加推荐系统的一个数据输出渠道(图5).

采集了用户行为日志的推荐系统不应“垄断”数据,而应将其算法决策转换为给用户的直观提示,例如用饼图为用户直观地展现每日阅读的各类新闻比例.用户的无意识行为助力的决策需要得到提示和反馈,以便使用户认知的不完备可以通过增强心理上的“自我反省”来弥补,这也是算法“可解释性”的基本*原则[23].

图5 增加数据反馈渠道的新闻推荐系统流程模型

总的来说,推动新闻推荐系统“信息茧房”问题的解决:

一是要提高新闻内容的广度与质量;二是加大对推荐算法精确度以外其他指标的考量,进行“探索利用”尝试;三是重视用户心理的自省,例如开发新闻推荐系统的相关插件,完善新闻推荐产品生态.

喻国明等学者在《传播学研究范式的创新:以媒介接触与使用的研究为例——用户媒介接触与使用的研究范式及学术框架》[24] 中指出,移动传播技术使传播行为复杂化和结构化,在考察新环境下媒介用户的媒介接触与使用特征时,可建立起适合移动互联传播环境的“时间—空间—媒介接触行为—社会关系—心理效果”五维研究框架.解决“信息茧房”问题,还需通过社会科学的理论研究,与自然科学的创新开发,共同推动新闻推荐系统的发展与创新,同时在新的技术与媒体环境中,更进一步认识当今数字化时代中新闻的责任、定位与发展方向.

该文评论:此文为一篇关于议题综述和茧和信息茧房问题方面的推荐系统论文题目、论文提纲、推荐系统论文开题报告、文献综述、参考文献的相关大学硕士和本科毕业论文.

参考文献:

1、 BS模式下银行风险监控信息系统构建分析 摘要操作风险是银行三大风险中的一种,随着操作风险事件的不断增多,各大银行加强了对操作风险的控制 利用网络信息技术构建操作风险监控信息系统,加强对银行各网点的风险管理与监控,以便及时发现风险并及时控制风.

2、 信息茧房对时政新闻传播的冲击和反思 摘 要 随着社会化媒体日益成为信息获取的主流渠道,公民的知情权和表达权得以回归,但另一方面,随着资讯的爆炸,社交化传播带来的问题也日益突显,“信息茧房”作为其中重要的一个方面正.

3、 嵌入式系统中数据库信息管理技术运用之 摘要论文主要以嵌入式系统中数据库信息管理技术运用之研究为重点进行阐述,结合当下嵌入式系统相关概述为主要依据,从针对性、社会适应性、实用性、实时性这四方面进行深入探索与研究,其目的在于加强嵌入式系统中数.

4、 个性化推荐系统对消费者购买意愿的影响 摘要随着电子商务的快速发展,电商平台逐步增多 为更好地满足消费者需求,提高消费者的购买意愿,个性化推荐系统在电子商务活动中得到普遍应用 本文从六个维度构建个性化推荐系统的具体关系模型,通过问卷调查与数.

5、 能否让算法定义社会传媒社会学视角下的新闻算法推荐系统 刘存地,徐 炜摘要互联网重塑了当代的媒体版图,新媒体已成为公众最重要的社会信息来源 同时,互联网也把人类带入了信息超载时代 作为对信息超载的应对,以大数据驱动的智能算法推荐系统席卷了互联网资讯平台 .

6、 医院人事档案管理中信息系统的运用 【摘要】随着社会的发展,医院的人事档案管理也发生了很大变化,信息系统运用于医院人事档案管理就是最好的证明 本文从医院人事档案管理的概述、医院人事档案管理的现状分析、医院人事档案管理在信息系统的运用入手.