华体会网址app:传媒查询 人工智能给新闻业带来哪些革新与应战
时间:
2023-07-07 |来源:hthvip华体会 作者:华体会软件

  人工智能(AI)的广泛运用给新闻业带来了革新与应战。清华大学新闻与传达学院教授、博士生导师,清华-伊斯雷尔·爱泼斯坦对外传达研讨中心主任史安斌与博士研讨生刘勇亮在《传媒查询》2023年第6期刊文,经过对9位媒体组织新闻作业者的深度访谈及相关材料剖析,回忆了AI赋能中西方媒体新闻出产的前史和现状,剖析了AI技能给新闻出产在内容倾向、隐私版权、信息实在等方面带来的应战,整理了从前言交融到人机协同的演进途径。为了习惯AI赋能新闻出产的愿景,咱们应当处理好出产力与创造力的联系,从头界定新闻从业者的作业身份,积极开展面向大众的AI素质教育。

  本年3月,由马斯克领衔千名业界和学界人士联署公开信要求暂停“练习”AI大模型,但此举却遭到比尔·盖茨等另一些人士的,后者着重应将要点放在怎么有用运用AI技能上。相同道理,一方面新技能带来的品德道德和作业身份的应战,让新闻从业者和大众感到忧虑,但另一方面AI给新闻出产转型晋级带来的机会令人振奋。为进一步知道AI对新闻业的影响,本文将对AI赋能新闻出产的前史和现状进行整理,厘清从前言交融到人机协同的演进途径,并对AI赋能新闻出产的愿景、应战及其应对提出方向性的主张。

  依照人工智能技能的开展阶段和其参加新闻出产的深化程度,能够将新闻业中的人工智能技能划分为三个阶段:辅佐增强、开端主动化与主动内容生成。

  在辅佐增强阶段,人工智能技能首要是作为辅佐东西参加到新闻出产的进程中,以前进特定环节的出产功率。例如翻译软件、语音转文字程序、错别字查看东西等,都是AI作为东西服务于新闻出产特定环节。这一阶段,干流新闻媒体组织经过与企业协作开发,推出了各类人工智能东西来服务新闻出产。例如,2018年以来,路透社一直在运用一个名为Lynx Insight的内部项目,以帮忙新闻记者剖析数据、提出故事设想,乃至编撰一部分新闻内容。

  本研讨对9位别离来自人民日报、新华社、中心广播电视总台、财新、彭博社等媒体组织的新闻作业者进行了深度访谈,一起对照伦敦政治经济学院教授贝克特(Charlie Beckett)编撰的题为《新权利、新职责:新闻业和人工智能全球查询》的陈述,讨论中外新闻业对AI技能的运用状况。依据新闻出产的流程和人工智能的技能特色,本研讨对新闻出产中的AI辅佐增强功用进行了如下类型学的剖析,整理出中西方新闻媒体参加者相同与不同的重视点。

  能够看出,中西方新闻媒体组织都现已广泛引进AI服务于新闻出产的首要环节,并存在着相似的AI技能运用场景,但在某些详细环节上也存在着运用的差异。从新闻搜集来看,AI首要被运用在信息搜集、舆情研判、数据剖析等新闻出产的前期准备作业之中。相比之下,西方媒体愈加重视AI的信息搜集才能,我国的干流媒体则愈加重视AI的舆情监测功用。从新闻写作来看,人工智能技能能够帮忙进行文本、图画、视频等内容的生成。在这一方面,西方媒体练习出很多主动新闻写作模型,并将其广泛投入到新闻实践之中。从新闻分发来看,人工智能技能在个性化推送层面具有明显优势,中外媒体在这一层面都充分发挥了AI的技能优越性。

  除了在特定的环节供给辅佐增强功用之外,人工智能还逐步开展出机器新闻写作的才能。在这一阶段,人工智能技能逾越了对特定环节的辅佐增强功用,逐步能够完结独立的新闻文本生成。

  早在2014年,便开端与Automated Insights协作开发新闻机器人Wordsmith来进行主动化新闻写作,每周能够生成数百万篇文章。在国内,腾讯的Dreamwriter、今天头条的xiaomingbot、百度的Writing-bots和榜首财经的DT稿王等,都是前期主动新闻写作机器人的代表。值得注意的是,这一阶段的机器新闻写作有必定的局限性,只能进行特定类型文本内容主动生成,例如体育报导、财经报导、气候地质报导和健康范畴报导等。

  ChatGPT的呈现,标志着人工智能现已进入到人工智能主动生成内容(AIGC)的新阶段。机器人记者能够经过机器学习和深度学习算法,从海量的数据和信息中提取新闻价值,并主动生成高质量、独立的新闻报导和剖析文章。

  自ChatGPT面世以来,多家传统媒体和新媒体相继推出了运用生成式AI的方案。新闻网站“嗡嗡喂”(BuzzFeed)宣告将运用ChatGPT为其闻名的性情检验供给支撑。《》运用ChatGPT创立了一个情人节音讯生成器。英国《每日镜报》和《每日快报》出版商Reach表明,该公司成立了专门作业组研讨怎么运用ChatGPT辅佐新闻写作,例如编撰交通和天气预报等新闻文体。此外,、路透社、、英国广播公司、等干流媒体均开端运用ChatGPT等AI东西来制作内容,供给个性化产品并以此前进受众的参加度。国内互联网企业百度开发的“文心一言”也宣告接入新京报、汹涌新闻、广州日报、我国妇女报等媒体,开端与新闻媒体进行深化的协作。

  跟着AI的开展和遍及,其在新闻出产中的运用也将带来出产本钱的下降和出产力的提高。例如,机器人记者能够经过主动化和智能化的方法,大幅度下降人力和物力本钱,然后减轻新闻组织的财政压力和经营危险。此外,经过主动化和智能化的方法,人工智能技能能够解放出更多修改和记者的出产力,然后出产更高质量、更有价值的新闻内容。

  首要,主动生成的内容往往存在着浅表的问题。尽管人工智能技能在生成文本方面现已取得了很大前进,可是其生成的内容往往仅仅针对事情的客观描绘,并不能像人类记者那样深化发掘新闻事情的内部和布景,也不具备一起的洞见和视角,是“不苟言笑的胡言乱语”。

  一方面,人工智能生成的内容一般短少一手信源和原创内容,这也是新闻报导的中心竞争力。因为无法直接接触到新闻事情现场或许与相关人员进行面临面沟通,人工智能在报导时难以获得实在的现场信息和细节,导致其出产的内容多是泛泛而谈,短少细节的弥补。另一方面,人工智能只能根据互联网上已有的信息进行文本编撰,这就代表着其输出的内容必然不是一手信息和原创内容,信息增量难以确保,新闻的价值也会因而大打折扣。

  此外,因为人工智能技能自身的约束,其在生成文本时或许会存在必定的倾向性,从而影响到新闻的客观性和公正性。例如,近期火爆的Dall-E、Stable Diffusion等人工智能图画生成模型扩大了人口刻板形象,特别反映在性别歧视、文明成见等方面。当提示创立“清洁人员”图画时,这些人工智能图画生成模型生成的一切图画都是女人,但假如要求其生成“工程师”时,一切的生成图画则都是男性。

  很多用户的个人信息在用户或途径不知情的前提下,被ChatGPT等大言语模型搜集到语料库中进行机器学习,违反了欧洲《通用信息维护》(GDPR)等隐私数据维护法例。意大利因而现已制止在境内运用ChatGPT,英国、爱尔兰等欧洲国家也启动了针对ChatGPT数据隐私问题的查询。

  此外,AI也往往在数据和信息版权方面存在争议。诞生不到半年的时刻,ChatGPT现已堕入与多家内容途径的胶葛之中。科技新闻网站CNET运用ChatGPT编撰了多篇文章,不只被指出内容存在多处过错,且被发现这些文章剽窃了其他受维护的信息来历。交际途径“红迪网”(Reddit)也宣告,将向微软、谷歌、OpenAI等公司收取数据运用费,因为这些企业都经过其运用程序编程接口(API),运用Reddit的途径内容来练习AI谈天机器人。

  尽管人工智能能够从互联网上抓取很多的信息,可是其间的实在性和可信度却难以确保,这就简略引发新闻报导的误解或许失实。一起,人工智能主动生成内容的另一严重危险——多模态虚伪信息的生成,也给新闻实在带来了愈加杂乱和难以辨认的应战。

  人工智能主动生成内容模型的呈现,使得虚伪信息的生成愈加敏捷且更具利诱性。他们能够在短时刻内生成很多虚伪信息,并借由网络途径广泛传达。此外,他们还会仿照人类的风格来润饰内容,使得出产出的内容愈加传神,致使大众难以区别真伪和来历。

  ChatGPT会伪造实际,并假造出虚伪的信息来历。美国加利福尼亚州的一位律师要求人工智能谈天机器人ChatGPT生成一份曾进行过性骚扰的法令学者名单,该程序则输出了一则关于乔治华盛顿大学某教授的性骚扰信息,还征引了《》2018年3月的一篇文章作为信息来历。但实际上,该教授从未被指控过性骚扰,AI所征引的《》报导更是不存在。当记者向由GPT-4(ChatGPT背面的引擎)供给支撑的微软“必应”(Bing)提出相同的问题时,它则再次假造了针对该教授的虚伪报导,并引用了他在《今天美国》上宣布的一篇专栏文章。与此相似,ChatGPT最近伪造了澳大利亚的一名政客因贿赂入狱的音讯,该政客因而要申述OpenAI诋毁,这也将是全球首例针对人工智能机器人的诉讼案子。

  人工智能之所以会生成虚伪信息,一个重要原因是其对信息来历的把关不严,构成虚伪信息污染语料库。AI自身短少区别真假信息的才能,这些大言语模型会广泛搜集互联网上存在的各种信息,不经挑选地加入到其机器学习的语料库中。除了新闻网站、政府网页、Reddit和等传统的信息来历之外,ChatGPT还整合了来自4chan等网站的数据,而4chan是一个充满着阴谋论和得罪性内容的在线论坛。面临大言语模型不经挑选的语料输入,能够想见,未来很多的虚伪信息会充满在媒体途径之上。

  除了人工智能主动生成文本假造的虚伪信息之外,人工智能主动图片生成模型所生成的多模态虚伪信息也开端众多。DALL-E(OpenAI开发的根据GPT的文本转图画东西)、Stable Diffusion、Imagen、Midjourney是当下根据分散模型(Diffusion model)被广泛运用的人工智能图片生成东西。此外,Lensa和谷歌开发的Dreambooth也都是人工智能图片生成的最新模型。这些东西和模型使得用户经过简略的文字描绘,便能够敏捷获取图片。

  人工智能图片生成的遍及带来了图片造假的众多。2023年4月,几张由AIGC途径生成的图片在全球交际网络疯传:美国前总统特朗普被捕,教皇穿戴时髦的白色羽绒服,马斯克与通用汽车首席执行官手牵手。这些图片看起来和现场拍照的新闻拍摄别无二致,假如没有事前被奉告由人工智能生成,受众很难区别其真伪。

  由人工智能生成图片模型形成的视觉虚伪信息具有极高的隐蔽性和煽动性。一方面,它们和此前的“深度造假”(deepfake)相似,经过视觉造假来利诱受众。因为其生成的传神程度,大众很难区别真伪。另一方面,相较于文字造假,图片造假等多模态内容造假愈加直观和更具冲击力,会对观众发生更为激烈的情感影响。因而,这种来自视觉的多模态造假很或许带来更为严峻的社会危机。

  愈加值得注意的是,与Photoshop或deepfake软件制作的视觉造假不同,人工智能图片生成模型只需输入几个简略的文本提示,便可在几秒钟内敏捷生成视觉媒体信息,并凭借交际媒体途径快速延伸。这种虚伪信息的“数字火灾”(digital fire)能够经过交际媒体途径快速传达虚伪图画或视频,完结了病毒式的分发。

  未来,伴跟着人工智能技能的进一步开展,新闻分发环节也很有或许进一步被人工智能技能所交融。在主动内容生成模型完结信息搜集和内容出产两个环节之后,AI能够凭借算法技能直接将生成内容分发给方针用户,完结完好的出产流程协同。

  伴跟着人工智能技能进入新闻出产的各个流程之后,不同作业分工之间的鸿沟也开端逐步消弭,新闻作业者能够凭借技能的力气成为真实的多面手。

  新闻记者能够将搜集到的一手材料上传给主动内容生成模型,凭借技能的力气来整理生成新闻稿件,淡化新闻修改的人物;新闻修改也相同能够经过自然言语处理大模型来搜索材料和数据,有用节省在信息搜集上的作业量。

  需求清晰的是,AI赋能新闻出产一直离不开人类的主导。ChatGPT需求新闻作业者的主导,作为帮忙他们处理事务的东西,而不是作为代替记者作业的独立产品。换言之,人机协同仍然是往后一段时刻内AI赋能新闻出产的首要形式。

  在当下和未来适当长的一段时刻,AI赋能新闻出产最大的作用是解放和开展出产力。一方面,人工智能投入到新闻出产之中,使得很多新闻作业者从重复劳作中解放出来,得以专心于创造性作业;另一方面,人工智能出产的高速度和高数量,也大大提高了出产功率。

  值得警觉的是,机器在解放出产力的一起,也存在消弭新闻作业者创造力的危险。当ChatGPT真实成为新闻出产环节中不行短少的东西时,新闻作业者将会越来越依靠该体系进行内容创造。假如新闻作业者一味沉浸于技能带来的便当、松懈高质量的内容出产,其创造力将逐步被消灭。到时,人工智能就或许真实由帮手“上位”成为主人,低质量的人工智能生成内容也将充满咱们的媒体途径。

  解放出产力和提高创造力自身并不矛盾。咱们等待的是在解放出产力的一起,将更多精力和人类才智投入到创造力的提高上。可是思想慵懒和技能依靠也或许将新闻作业者和整个新闻业拖入创造力颓靡的深渊。

  在人工智能年代,记者的使命不只仅是出产新闻,更重要的是做好信息挑选和新闻把关,即新闻作业者怎么从海量的资讯之中选取最有价值的信息传达给受众。面临全方位的信息危机,记者的人物更多地从信息出产者转变为信息把关者。因而,咱们除了重视怎么运用人工智能出产消息,更要考虑怎么凭借人工智能来过滤噪音、核对实际、把关要害信息。

  人工智能技能将会代替新闻出产中的部分机械性劳作,可是彻底代替新闻作业者则为时髦早。AI赋能新闻出产已然成为一种实际。面临来势汹汹的ChatGPT,咱们不用过于惊惧。尽管人工智能对新闻出产的革新势不行挡,可是远未开展到代替人类记者和修改的境地。ChatGPT在新闻业的运用仅停留在辅佐功用,只能作为新闻出产的助理,无法作为新闻出产的原创者。

  此外,伴跟着AI与新闻业的深度交融,新闻工作也将会呈现更多新的职位,例如算法工程师、模型练习师等,这些作业的呈现和存在将使得AI真实深度嵌入到新闻出产之中。

  在人工智能与新闻业深度交融的未来,咱们更需求不断提高社会大众的判断力,以应对虚伪信息和低质量信息带来的信息危机。因而,有必要将前言素质教育提高到AI素质的维度,从更为微观的视角来培育大众的技能区别才能。

  前言素质是个人和前言一起培育的成果,一起也或许遭到政治参加的影响。因而,大众前言素质和AI素质的提高,是一个多方尽力的成果。AI素质的提高首要需求官方的干涉。2023年4月,中心网信办发布了《生成式人工智能服务管理办法(征求意见稿)》,生成式AI的监管也逐步归入到政府议程中来。根据这一管理办法,我国的生成式AI将得到更为标准的开展,必定程度上躲避ChatGPT、Midjourney等途径存在的问题。

  AI素质的培育是一个长时间的进程,需求伴跟着智能前言的遍及来逐步完结。就像智能手机从诞生到遍及,短短几年时刻内,社会大众现已能娴熟运用各大品牌的智能手机,而且具有了必定的数字素质。能够想见,伴跟着ChatGPT等主动生成内容人工智能技能的开展和遍及,大众也会逐步习惯人工智能产品的运用方法和出产逻辑。

  (载《传媒查询》2023年第6期,原文约10000字 ,标题为:从前言交融到人机协同——AI赋能新闻出产的前史、现状与愿景。“传媒查询杂志”大众号原文链接

  【作者简介】史安斌,清华大学新闻与传达学院教授、博士生导师,清华-伊斯雷尔·爱泼斯坦对外传达研讨中心主任