哈希娱乐- 哈希游戏平台- 游戏官方网站【笔谈】平台治理的全球问题与中国实践
哈希官网,哈希娱乐,哈希平台,哈希游戏平台,哈希游戏玩法,哈希竞猜,哈希游戏官方网站

(中央民族大学新闻与传播学院教授,博士生导师,中央民族大学互联网平台企业发展与治理研究中心主任)
姬德强(教育部人文社科重点研究基地中国传媒大学国家传播创新研究中心主任、网络强国研究中心执行主任,教授,博士生导师)
出处 :《郑州大学学报(哲学社会科学版)》2026年第2期(如需转载,请注明转载来源)
编者按:伴随生成式人工智能的迅猛发展,平台治理已成为全球性议题。本期策划的笔谈“平台治理的全球问题与中国实践”,旨在通过跨学科视角,探讨平台治理的前沿问题与中国路径。四篇稿件从不同角度切入平台治理的复杂维度,回应平台治理的全球性挑战。《大模型基座上的平台变革》一文,剖析了大模型嵌入平台后引发的架构之变、搜索之变、生产之变、互动之变、商业之变和治理之变,揭示了平台从“连接逻辑”向“生成逻辑”的必然转向,为理解平台生态的未来走向提供了理论框架。《从平台社会到平台国家:中国平台研究的国家视角》指出,应关注“一个国家的平台化”经验,找回“国家”概念以及平台与国家的互构关系,进而从整体上理解发展型大国的平台化以及中国实践对平台研究的贡献。《主流媒体平台依赖的在地性与国家调适机制》作为对上文的回应,聚焦中国语境下的媒体与平台关系,指出这种关系并非纯粹的市场博弈,而是被深刻嵌入“国家-市场”双重权力结构之中,治理的前提是将平台的市场逻辑校准至国家治理轨道,在国家层面构建一套系统性的调适机制。《基于循证决策的平台算法审计》则从技术治理层面,构建以“证据获取-证据评价-证据转化”为核心的平台算法审计框架,形成平台审计算法的循证决策模型,为应对算法风险、保障社会公平提供了方法论支持。本期笔谈探索了中国语境下的平台治理路径,为平台社会的全球治理提供了兼具地方性与全球性的问题理解与解决方案。
2017年,阿什什·瓦斯瓦尼(Ashish Vaswani)等人在《Attention Is All You Need》一文中提出Transformer架构,其独特的注意力机制,为处理长距离依赖的序列数据提供了高效解决方案,也无意中开启了通往大模型时代的大门。此后的数年间,以BERT、GPT系列为代表的模型经历了从“炼大”到“炼巧”的演进,模型参数量呈指数级增长,能力范围也从最初的自然语言处理逐步扩展,展现出通用人工智能的雏形。自2022年OpenAI推出ChatGPT以来,微软、谷歌等主要平台提供商已开始将GenAI功能集成到其核心产品中,同时专门围绕GenAI构建的新平台也不断涌现。到2025年初,无论是中国的腾讯、阿里巴巴、百度等头部平台企业,还是Google、Meta等全球企业,都不再将大模型仅仅视为一个功能或应用,而是将其作为整个技术体系的“基座”。这意味着,平台的核心逻辑正经历从“连接”到“生成”的根本转变。过去,平台以连接为中心,依赖算法聚合信息与用户,实现注意力的高效捕获与分配;而今,平台则转向以生成为核心,依托大模型的理解、推理与创造能力,直接为用户生成内容、执行任务、提供解决方案。这一转型标志着平台正迈入一个以“生成力”驱动价值创造的新纪元。
基础设施是一个由中心、节点、线路及终端组成的公共技术系统,作为一个有机整体,它不仅是人类生活的物质前提,更是支撑社会有序运作的基底性框架。在数字技术的加速迭代下,基础设施的内涵逐渐从物理空间向数字空间扩张。传统的基础设施以交通、能源、通信为核心,支撑着人类社会的物质流动与信息交换;而数字基础设施则以云计算、大数据平台、人工智能技术为支柱,重塑着知识生产与价值创造的逻辑。近年来,以Transformer架构为基础的大语言模型,凭借其泛在赋能性与技术突破性,重构人类与数字世界的交互范式,成为驱动千行百业智能化转型的底层基座。
大模型的规模化涌现是其作为基础设施的核心特点之一,指模型在参数规模、训练数据和计算资源达到一定阈值后,突发性地展现出先前小规模模型所不具备的能力。根据复杂性科学,涌现能力源于系统内部元素的非线性互动,当规模扩大时,整体行为超出部分之和。大模型的涌现能力体现在多个层面。首先,在认知任务上,小模型往往局限于模式匹配,而大模型能实现零样本学习,实现从“记忆”到“推理”的质变。其次,规模化涌现的优势在于提升了基础设施的鲁棒性和通用性。作为平台基础设施,大模型无需针对每个任务重新训练,即可涌现出适应新场景的能力,这大大降低了部署成本并加速创新扩散。然而,这一机制也面临质疑。有学者表示,所谓涌现可能只是度量指标的选择性幻觉,通过调整评估方法,涌现效应可能消退。尽管如此,从实践层面来看,规模化涌现已经直接促成了如ChatGPT等应用的成功,证明了其在信息处理机制方面所带来的革命性变革。
多模态响应是大模型的另一关键特点,指模型整合文本、图像、音频等多类数据,通过跨感官信息的融合与交互,构建更接近人类认知的符号互动系统。在技术机制上,多模态大模型借助视觉-语言预训练方法,将不同模态的数据映射到统一维度,从而实现跨模态语义推理。而从人机交互的视角看,多模态响应推动了人机互动由单一符号系统向多符号融合范式的转变。一方面,多模态大模型能够捕捉非语言符号中蕴含的隐含信息,增强交互过程中的理解能力与共情效应;另一方面,通过多模态信息之间的互补与验证,有效降低了单一符号表意可能带来的歧义。正如克里斯托夫·施密特(Christoph Schmidt)等人所指出的,该融合机制的优势在于实现无缝的人机交互,使GenAI能够应对现实世界中更为复杂的场景,展现出在教育、医疗、无人驾驶等服务领域中的广泛应用潜势。
语境学习的泛化能力是指模型在不更新参数的情况下,通过提示中的少量示例,将其知识泛化至新任务,并实现从语义理解到语用推理的跨越。在认知语言学中,语义与语用之间存在明确界限:语义侧重于语言表达的字面意义,而语用则关注意义在具体语境中的实现。传统的自然语言处理模型多依赖规则或统计学习的方法处理语义任务,但在捕捉语用层面的隐含信息层面存在明显的局限。而大型语言模型能够借助用户提供的少量示例,学习特定语境下的任务规则,并动态调整其输出的风格、重点与内容。因此,大型语言模型在语用推理方面的扩展,成为实现自然、高效人机对话的关键。此外,凭借其出色的泛化能力,大模型能够在面对全新领域时,通过已有知识进行逻辑推理。这种能力不仅保证了大模型作为基础设施的通用性,也有效避免了为每个细分领域重建复杂模型所带来的成本。
大模型的开放与闭源并存,构成了其作为新基础设施的独特特点。以OpenAI的GPT系列、Google的Gemini和Anthropic的Claude系列为代表的闭源模型,代表了当前技术的前沿。通过API服务的形式,这些模型提供了稳定、成熟且易于集成的解决方案。与闭源模型相对应,以Meta的LLaMA系列、Mistral AI的模型以及Hugging面向社区为代表的生态极大地促进了技术的民主化。研究者和开发者可以自由地访问、修改和分配模型权重,从而进行深入的学术研究以及定制化的应用开发。需要注意的是,开放与闭源绝非对立关系,两者共同构成了一个动态平衡、相互促进的健康生态。这种“双轮驱动”模式,既保证了前沿技术的“深度”,又拓展了技术普及的“广度”,是大模型作为新基础设施能够迅速且健康发展的优势所在。
传统平台架构的核心在于数据集成,依托关系型数据与算法实现内容的存储与分发。该逻辑本质上是一种静态整合模式,高度依赖预设规则来处理输入与输出,因而在面对高度复杂与不确定的情境时,往往表现出适应能力不足的局限。相比之下,大模型引入生成逻辑,通过大规模预训练、注意力机制以及持续的微调,实现内容的动态涌现。这种架构之变赋予系统更强的创造性和上下文理解能力,使其能够基于实时输入产生高度个性化与原创性的内容。由此,平台从信息中介升维为“世界模型”,不仅能够主动构建并优化用户体验,也催生出更具活力与创新的内容生态。
搜索是平台连接用户与信息/服务的入口。传统搜索依赖关键词匹配和个性化算法的协同,从而实现信息的检索与相关内容的集成性推荐。大模型的平台内嵌,使原本的信息检索进化为任务执行。大模型凭借其语义理解能力,不仅能够准确解读用户的显性查询信息,而且通过语用推理机制,进一步推断用户的隐性需求。由此,平台不再局限于传统的算法推荐范式,而是能够直接响应用户复杂的任务指令,主动完成功能的调用与服务的组织。不仅增强了用户的体验感,而且增强了平台的服务能力以及用户黏性。
内容生产是平台生态的活力源头,平台经济的繁荣在很大程度上依赖于用户生成内容(UGC)和专业生成内容(PGC)的持续供给。然而,大模型技术所带来的生成式人工智能内容(AIGC)正对平台既有的内容生态造成结构性冲击。相较于UGC与PGC生产周期长、成本高、质量不稳定及存在规模瓶颈等局限,AIGC能够自动生成高质量、多样化内容,从而实现大规模的输出与持续的创意涌现。当然,AIGC与UGC/PGC之间并非简单的替代关系,而是构建了一种人机协同的新型内容生产范式。AIGC的作用在于增强而非取代人类的创造力,推动内容生成向更高效、更多元的方向持续演进。
传统平台上的互动,本质上是一种被动连接,由平台提供空间和工具,用户主动发起并维持连接。而嵌入大模型的新一代平台,正在催生一种以主动对话为特征的新型互动关系。该类平台通过拟人化交流机制,支持对交互过程的主动干预与多代理协作。以智能手表为代表的具身技术便是典型例证,其通过持续捕获用户的生理信号,主动推荐匹配的音乐或健康建议,并借助集成的大模型能力开启主动对话场景。这一机制既增强了用户参与感,也提前触发了平台对用户价值的预判与关注,从而在更早阶段实现服务响应与资源适配。
大模型的平台嵌入,使平台的商业模式正在经历一场从以流量为核心到以价值和算力为核心的转变。传统平台经济,特别是内容和社交平台,其主要商业模式是“流量经济”或“注意力经济”,即通过免费内容吸引海量用户,再通过广告变现。而大模型使得平台能够提供更高阶、更具个性化的“价值服务”,如AI问诊、深度研究服务等,开辟了新的付费增长点。此外,大模型的训练和推理需要消耗海量的计算资源,这使得算力本身就成为一种核心的、具有战略价值的经济资源。由此,平台的竞争,在很大程度上转变为对GPU等高端计算芯片的争夺和对算力成本的优化能力。
目前,大模型已成为推动数字化转型的核心驱动力。其影响不仅体现在技术革新层面,还沿着产业链向上游与下游持续传导,重构了整个互联网产业的价值网络。大模型产业链可划分为基础层、模型层和应用层三个主要层次。基础层是产业链发展的基石,主要涵盖算力基础设施、数据服务等多个关键领域,具体包括AI芯片、服务器、数据中心及高性能计算集群等,为大模型的高效运行提供必需的硬件支持。据GMI统计,全球AI硬件市场规模预计将从2025年的668亿美元增长至2034年的2963亿美元,复合年增长率达18%。在中国市场,百度2025年第一季度总收入同比增长7%,其中AI云业务增长尤为显著,同比增幅达42%。
营销作为企业最贴近市场的业务环节,正全面拥抱大模型技术。传统的个性化推荐基于多用户的历史行为数据,是一种反应式的个性化。大模型则通过对用户自然语言评论、社交媒体发帖、对话询问等非结构化数据的深度语义理解,构建出更为精细、立体的用户画像。在此基础上,企业可生成高度定制化的营销文案、广告图像乃至宣传视频,实现“千人千面”的沟通策略。此类生成式个性化已不再局限于商品推荐的差异化,而是能够以高度适应用户实时心理状态与语境的方式开展对话,推动营销范式从“个性化人群”到“个性化个体”的营销范式升级。根据腾讯的2025财报数据显示,第二季度广告收入增长20%,该增长主要得益于大模型在营销中的广泛应用,显著提升了广告点击率与触达效果。
此外,大模型在聊天平台中的应用实现了品牌的无缝渗透,避免了传统广告的生硬感,借助主动且个性化的互动有效提升转化率。以AI聊天机器人为代表,其不仅能处理复杂查询,提供即时推荐,而且还能基于用户行为动态调整对话路径,从而在消费决策的关键阶段提高转化效率。根据《2025RepAI电商消费者行为报告》,AI驱动的对话互动在电商场景中表现突出,其平均转化率达到12.3%,较无AI辅助情形提升近四倍。
模型即服务(Model as a Service,MaaS)是大模型时代最具代表性的商业模式创新,它将复杂的AI模型封装成标准化的服务,通过云平台向企业和开发者提供按需调用的能力。API经济是MaaS模式得以实现的技术和商业基础,它通过标准化的接口,将大模型的核心能力开放给外部开发者和企业,从而构建起一个庞大的、相互连接的智能化服务网络。该模式强调互联性与可组合性,支持开发者将大模型灵活嵌入现有系统,实现生态闭环。2024年全球API管理市场规模为90.7亿美元,预计到2034年将超过1693.3亿美元。
在以大模型为技术基座的新一轮平台变革中,未来平台实践将进一步释放生成逻辑的潜力,并逐渐推动智能体与超级应用深度融合的生态体系构建。智能体作为大模型驱动的核心,能够模拟人类认知过程,通过多代理系统实现自主决策、任务分解与执行优化。在实际应用中,像GPT系列、Grok模型等驱动的智能体,在医疗诊断、科研模拟和创意设计等领域都展现出非凡潜力。而超级应用则依托大模型的整合能力,构建出集社交、支付、内容生成等多模态功能于一体的一站式生态体系。以智能体为驱动引擎、以超级应用为落地载体的平台生态,将深刻重塑平台的实践范式,推动平台从“连接主导”迈向“生成主导”转型,进而开启以“智能共生”为特征的新数字经济形态。
面对大模型带来的平台变革,学术研究亟须议程再造,以系统回应智能时代所带来的多维挑战。当然,这种议程再造并非止于研究主题的拓展,更意味着对平台理论基础进行深刻反思,以构建融贯技术、社会与伦理的跨学科视野。在理论层面,未来研究应关注“生成范式”的相关概念化工作;在传媒经济的实践领域,研究议程也应该从传统平台经济理论的双边市场模型转向生成性市场,充分挖掘智能经济的潜力。同时,学术研究还须聚焦于智能时代中出现的隐私泄漏、算法偏见与深度伪造等结构性风险,为构建可持续的智能生态贡献学术智慧。
近年来,在政策、资本、技术的三重推动下,商业互联网平台携带其超级应用(super app)正在系统性渗入人类社会,从生产、生活到治理与文化的各个方面,快速实现着从应用工具到基础设施的角色转变,加速从地方平台到全球平台的空间扩张。在此过程中,作为一个跨学科领域的“平台研究”(platform studies)在国际学术界兴起,不仅形成了相对稳定乃至有地域和学派特色的学术网络,而且推动了这一领域的系列专著出版(如《Chinese Platforms:A Critical Introduction》)和专业期刊问世(如《Platforms & Society》),为理解这一数据权力高度集中、跨域存在并且日渐呈现出更多“地方性”的多边传播装置,做出了重要的学术贡献。
然而,在西方学者主导或受其影响的平台研究议程中,对拥有最丰富和最前沿的平台化实践的中国社会,依然陷入了“例外主义”的认知窠臼之中:一方面将中国社会的平台化放置于市场与社会的互动框架内,考察其经济模式、技术架构和应用生态的独特性(比如无所不包的超级应用、对数据获取和算法推荐更为极致的使用等),及其引发的日常生活实践和文化表征的变化;另一方面也往往将更具干预性的国家权力视为一种压制结构,或者将其后台化不作讨论,或者将其作意识形态化解读,暗喻着一种国家主导的与平台之间的权力互构关系,甚至在全球语境下提出“技术民族主义”(techno-nationalism)和平台国家主义(platform nationalism)的学术疑虑。即便意识到中国平台系统的创新性、独特性或称另类性,也努力将其进行“陌生化”处理,但上述平台与市场、平台与国家的二元关系始终占据着中国平台研究的主流位置,尤其从一个侧面聚焦国家权力(state power)的系统性渗透,而往往对国家为何及如何如此运作缺乏内在视角和经验的补齐。
简言之,这一例外化、他者化甚至偶尔传递冷战意识形态色彩的研究倾向,不仅无法为在地、动态、复杂、立体的中国社会平台化实践构建有效的解释体系,而且没有“以中国为方法”,更没有“以亚洲为方法”,进而“由下而上”代表更广泛的发展中世界,推动平台研究在全球范围内的知识增殖和范式创新。这无疑也是平台研究需要深度“去西方化”的原因所在。
基于以上分析,本文提出“平台国家”(platform nation)的概念,认为应推动从“平台社会”到“平台国家”的概念转向。与萨宾娜·米尔奇(Sabina Mihelj)所提出的平台从技术想象、内容策展到基础设施的国家化(nationalizing)不同,本文并不是强调国家与企业力量的结合进而对全球平台进行分割,而是希望在平台研究中重新“找回国家”,而这个国家视野不仅是宏观的、整体的和非竞争的,更在国家建设意义上与发展中国家存在显著差别,至少需要照顾到超大规模人口结构、均衡和包容式发展的合法性诉求,以及作为社会集体心理的安全稳定观。此外,本文希望超越这一生态系统中的单一利益相关者视野,比如政策制定者、规制实施者、平台企业、不稳定劳工等,为政策和实践中所形成的对平台角色的复杂理解——至少包括创新增长者、经济赋能者、市场垄断者、社会稳定者——提供更合理的解释性框架,也以此矫正暗流涌动的平台研究的新自由主义倾向。
沉浸式的平台化生活是中国平台研究最为丰富的田野经验来源,这也是国外平台研究学者纷纷来到中国进行体验和交流的原因之一。过去十多年来,如果说平台研究的视角和理论引入,乃至学术议程设置和学术范式创新更多来自欧美学者,那么更为丰富的平台化生活经验,以及更具层次性和多样性的平台知识生产,则更多来自以中国为代表的东亚社会乃至整个发展中世界。这部分是源于发展型国家(developmental state)对社会平台化所带来的经济增长、就业增加、文化繁荣及其对政治合法性提升的趋势性认知,也同时包含对这一创造性破坏进程所带来的各种风险的计算与平衡。换言之,面对平台资本主义在全球的崛起,发展中国家需要在发展与安全之间做出优先级选择,并根据自身资源优势和治理动嵌入乃至改造地方化的平台社会建设路径。这也契合了当下平台研究从全球性规范视角转向地方性模式和经验讨论的变化趋势。
回到中国田野,平台化经验的丰富程度正在或者已经超越已有平台理论的解释边界。这一经验与理论的差距至少表现在三个方面:首先是技术功能的融合性,尤以微信这类平台型应用为代表。少数几个集纳了技术和资本优势的互联网巨头,将技术功能的跨界融合作为入口竞争的主要手段,打造出超越全球同类产品功能边界的、提供几乎全域服务(也因此被修辞为基础设施般的存在)的、依托算法推荐可以精准定制的超级应用。如果说APP成为基础设施更多来自西方学者的有限经验和逻辑想象,那么这一趋势在中国庞大的平台社会中更具实践色彩。其次是市场竞争的激烈性,尤以平台经济的快速迭代为特征。宽松的政策环境和积极的用户参与不仅孵化出以拼多多为代表的低成本、规模型平台企业,更使得各类平台企业在各自垂直领域乃至整个平台经济生态中持续进行着激烈乃至惨烈的市场竞争。2025年的平台外卖大战就是典型表现,其所引发的对实体经济链条、劳动力市场、城市生活习惯的影响将在更长时间内显现。在这个意义上,中国的平台经济是最活跃的也是最具不确定性的。
最后,也是最核心的,是国家权力在社会平台化进程中的系统性干预,由此也形成了不同于西方语境中的平台社会景观,而更像在建设一个“平台国家”(platform nation)。在这片充满商业创新、政务转型、文化表达、消费参与、劳动实践的平台田野中,我们沉浸式感受到的是“一个国家的平台化”,既包含西方学术取景框中那个经常被带着有色眼镜进行远观的国家力量(特指中国特色的“政家”)及其对平台化进程的系统性融入或者干预,更包含对整个国家的生产体系和生活世界的快速平台化的深刻体悟,当然也有对数据透明、治理长效性的关切。因此,跳出已有平台研究对“国家”概念的狭义理解,将政党、政府、市场、社会的有机联系作为理解国家整体性的逻辑支撑,才有可能把握住一个形成中的“平台国家”全景,也能有效回应如“普通人的‘国家’理论”这类总体性观念在中国社会中的普遍存在。
从国家发展的角度理解平台,当然不是独属于中国的视角和经验。从学术史的脉络来说,关注整体性意义上的“国家发展”首先来源于第二次世界大战后,美国在与苏联的整体性对抗中所发展出来的——尤其是针对拉美为代表的新独立国家群体——一整套政治、经济和意识形态战略,即以西方现代性为内核的同一化模型,也称为“主导范式”(dominant paradigm)。其中,美国主流传播学者通过将发展知识和话语与国家独立、人民启蒙与富有、政治现代化相关联,提供了与苏联更具意识形态感染力、更高计划组织效率的国家动员和建设模式相抗衡的国家发展与传播模式,以吸引虽然新获独立但仍深陷后殖民主义泥潭的国家尤其是其统治阶级的注意力。20世纪后期,这一发展模式虽然在第三世界的觉醒中变得有些飘摇不定,但随后也在社会主义阵营的解体过程中获得了多变体的延续。
上述发展型国家模式高度强调一种线性的演化观念和在世界体系内的“阶级跃升”目标,于是,在一种落后与先进的二元对立框架里设置了各个国家的阶级方位。为了实现发展目标,国家干预或者说对各类资源和能力的统筹协调,被认为是必要的手段。正如亚历山大·格申克龙(Alexander Gerschenkron)所说,“在(所谓,本文作者加)‘落后国家’的经济发展进程中,国家的角色日益凸显”,而发展型国家虽有制度和路径差异却也一同呈现出如下整体性特征:一是国家具备是否选择嵌入世界体系的自主性;二是国家具备产业政策的制定与实施能力;三是这种国家能力依托技术官僚群体的知识和文化优势;四是往往依赖较大范围内的政企协作;五是国家发展具有历史阶段性特征,因此需要处理好发展目标与其他目标的不一致;以及比较核心的,对工业化进程和科技创新的高度重视。
值得注意的是,不管是产业政策还是技术官僚,都与科技驱动的国家发展有着更为密切的关系。有学者提出了“科技发展型国家”(techno-developmental regime)的概念来强调国家的工具理性,当然也以此描述中国。除了国家决策的理性化,支撑一个发展型国家的力量还包括大众传播意义上的集体性的、共同性的社会技术想象(sociotechnical imaginary),也就是技术官僚和企业精英至少在定义未来国家发展目标上,与社会大众达成某种一致。在这个过程中,媒体或者说媒介的说服性和协商性角色变得十分重要。上述要素的结合为理解“平台国家”的崛起提供了一个重要的历史脉络。换言之,跳出20世纪冷战背景下发轫的发展型国家历史,我们可能无法理解作为技术、资本和政治联合体的数字平台,如何与国家发展实现了系统性互构,而不是如众多西方学者站在后现代境况中和伦理高地上,对平台化进程中国家、市场、社会力量的持续拆解,以及拿着显微镜不断放大那些“期待中的问题”。
然而,即便我们已经在发展型国家的范畴中找到了平台与国家互构关系的历史脉络,为“平台国家”这一概念或者说“理想型”做了初步的合法性确认,但也不能直接将其简单套入对中国的理解中。这至少是因为中国拥有大多数中小规模发展型国家不具备的一些显著特征,比如超大规模市场、复杂央地关系,以及较强的地方主义,尤其是政党-国家一体化的政治体制,以及与东亚国家共享的儒家文化、政治等级等。当然,更值得关注的是,20世纪至今,中国在最大程度上实现了大多数发展型国家看似具备实则孱弱的国家自主性和自决性问题。这一方面源于内部庞大的市场和产业规模及其提供的发展韧性,另一方面也扎根于文化自觉和政治自主的历史意识及其在国家建设层面的制度化。因此,理解平台国家的兴起,不仅要以中国为案例,还需要以中国为方法,从特殊性中挖掘更具一般意义的平台国家化和国家平台化的双向互构进程,或称平台研究的一种国家视角或国家理论。
在上述语境下,平台国家概念的提出无疑是一种立足中国田野的整合性路径,在超越一系列二元对立逻辑之后所尝试构建的一种拥有广泛解释力的平台研究的地方性知识。在这个意义上,平台国家研究的自主性知识生产既不接受一种源自西方社会文化传统的前置性的规范性框架,尤其是必须在商业性扩张与公共性保护、国家压制与社会反抗之间做出选择,而是聚焦国家发展的整体性意义;也不限于事无巨细地对微观经验性现实的描绘,以及对垂直领域平台研究边界的廓清,并将其归结为一种个人主义或学科意义上的学术旨趣,在画地为牢的过程中封闭了与更广泛的国家行动之间的对话。相反,一个平台国家的理论视野更关注一种总体性现实,正如张志安所说:“考虑到国家在总体资源分配中所扮演的核心角色,以及超级平台的基础设施属性的日益凸显,‘国家-平台’关系以及二者相结合所构建的技术驱动的资源分配与治理体系,应当成为中国平台社会研究的总体语境与逻辑起点。”可以说,这种回归国家或者回归宏观的学术视野转向,既来自平台与国家日益深化的相互建构的现实,也源自中国学者在与全球范围内平台研究前沿持续对话的过程中所生发的一种学术自觉意识,是重新反思平台研究的地方性的可贵努力。在这种新的学术意识中,中国不再是学术权力格局中作为边缘的地方,而是有可能提供更具国际性的知识生产的具有主体性的地方。
最后,我们可以以中国为方法,为理解平台国家这一概念设置几个基本的学术维度,提出一些需要被持续关注和回答的问题。首先,平台国家具有规模性特征,与庞大人口的多元现代化进程密切相关,这在国际比较研究中是一个必须被正视的国情问题;其次,平台国家高度关注科技和商业创新在解决增长和就业问题上的积极作用,即便会带来暂时性的不平等乃至剥夺性关系;再次,平台国家注重建设普惠性的新型基础设施,提供更多数字融入而不是数字排斥,并为此进行大规模的二次分配;最后,平台国家拥有较为统一但不排外的技术文化想象,甚至比众多发达经济体更拥护技术世界主义——而不是技术全球主义——的愿景,因此也更能提供构建新型地球村的实践基础和想象资源。总而言之,在从平台社会到平台国家的学术视野转向中,我们不仅要持续关注人类社会平台化的新进展,更需要在深度去西方化的过程中对“国家”概念再度“祛魅”,才能全面把握一个“平台中国”的全貌,构建起一套“复线”的知识框架和解释体系。
党的二十届三中全会提出“构建适应全媒体生产传播工作机制和评价体系,推进主流媒体系统性变革”,直指全面增强新闻舆论工作的“传播力、引导力、影响力、公信力”的核心目标。在此背景下,主流媒体与商业平台的关系,这个长期困扰新闻业可持续发展的结构性难题,被前所未有地推向了聚光灯下。
随着超级互联网平台的基础设施化,新闻生态系统发生重大变革,主流媒体的中心枢纽地位被改变,越来越多媒体开设平台矩阵账号、追求平台流量数据、专业价值对商业价值有所让位,从而导致平台依赖现象日趋凸显。主流媒体和商业平台的关系,不仅是关乎商业模式或技术应用的战术问题,而是决定主流媒体能否在新时代舆论格局中占据主导地位、履行其政治使命的战略议题。这场自上而下的主流媒体系统性变革,以其强大的行政推力,促使各级主流媒体尤其是地方主流媒体,必须重新审视并定位自身在数字生态系统中的位置。
学术界对媒体与平台的关系已积累了丰硕的研究成果。Poell和Nieborg提出的“平台化”(platformization)概念,概括了平台作为一种集数据基建、市场与治理模式于一体的复合体,如何渗透并重塑文化产业(包括新闻业)的运作逻辑。学界普遍关注平台权力(platform power)的崛起,并从多个维度展开相关研究。
在文化与规范层面,学者们探讨了平台逻辑如何与新闻职业理念发生碰撞。平台通过其可见性赋权,鼓励记者进行个人品牌打造和“表演性真实”(performed authenticity)实践,但这往往使记者暴露于网络骚扰的风险之下。同时,平台可供性通过一种“平台学院化”(platform schooling)方式,鼓励媒体追随四种新兴的“成功新闻业”规范:追求平台广泛传播、熟悉平台竞争规则、吸引平台定义的“忠诚读者”以及通过平台实现盈利。
在基础设施层面,相关研究揭示了平台权力更为隐蔽的运作方式。权力不仅体现在内容分发,更深植于平台基础设施的基础架构中。对平台前端标记(markup)的研究发现,新闻机构所使用的内容管理系统(CMS)的成本与技术能力,直接决定了其内容在搜索引擎和社交平台上的可见性。这导致资源匮乏的、服务特定社群的媒体在可见性上处于天然劣势。这种依赖性甚至超越了平台层面,延伸至海底光缆、数据中心、内容分发网络(CDN)等更底层的互联网骨干网络,这些网络大多由私营、外国实体控制,形成了新闻业在数据主权、分发控制和司法管辖上的“超越平台的俘获”(capture beyond the platforms)。
然而,如果将这些研究的结论置入中国语境进行阐释,往往会遭遇一定的局限性。它们倾向于将平台视为纯粹的市场行动者,其权力逻辑主要源于资本与技术,而将国家这一关键变量,多定位为平台的外部监管者或媒体的宏观调控者。平台权力行使的地缘政治维度不应当被忽视。对中国的互联网平台,如今日头条的研究已清晰表明,国家并非仅仅是外部的、滞后的规制力量,而是早已深度嵌入平台内部运作、并与市场力量形成复杂共生的新型权力形态。
这种将国家、市场(平台)、媒体三者视为相对独立并存在博弈关系的分析框架,虽然解释了部分现象,但对于理解中国新闻业的平台化而言,尚不够深入。因此在把握全球共通性的基础上考察中国互联网平台的在地性特征,以及互联网平台与主流媒体的在地性关系,显得格外重要。
换言之,中国主流媒体与平台的关系,受到行政逻辑与平台逻辑的调节。一方面,媒体深度融合是提升国家治理能力、巩固壮大主流思想舆论的重大战略部署。这一自上而下的战略要求,构成了媒体积极拥抱平台、利用平台渠道和技术提升传播效能基础动力。在实践中,传播效果的达成,往往需要借助平台触达更广泛的受众,这使得媒体在平台上的表现成为衡量其融合转型成效的重要维度。
另一方面,商业平台作为市场主体,其运行遵循以用户为中心、以流量为基础、以算法为核心的市场逻辑。媒体为了在平台生态中获得生存与发展空间,必须适应这套规则,比如生产算法友好的内容、运用平台化的互动方式等。这是媒体在市场竞争环境中,为了获取用户和影响力而进行的必要适应。
这两种逻辑并非相互排斥,而是相互交织、彼此强化,共同构成了当前媒体与平台关系的复杂底色。行政逻辑为媒体进入平台提供了强大的动因和方向指引,而市场逻辑则规定了媒体在平台内行动的具体方式和路径。在行政与平台双重逻辑的共同作用下,主流媒体和互联网平台的关系呈现出一些在地性特征。
在媒体深度融合的进程中,一个显著的结构性特征是平台可见性资源高度集中于中央主流媒体。这一现象首先源于一种“强强联合”的战略选择。处于核心地位的中央级主流媒体,凭借其固有的权威性、深厚的资源积累和在国家战略布局中的关键角色,与顶级的商业平台建立了超越普通内容入驻的紧密战略合作关系。
这种合作是多维度的,不仅涵盖内容分发的优先权,更深入到技术共享、数据互通、重大项目共建等层面。作为合作的一部分,商业平台会向这些旗舰级媒体伙伴提供宝贵的流量倾斜、更高的算法推荐权重以及专属的技术支持。这一系列举措的直接成果,是成功打造了一批用户规模庞大、传播力强劲的新型主流媒体“航母”,它们成为网络舆论场中稳定和引领议程的核心力量,这正是媒体融合战略所期望达成的重大成果。
然而,这种顶层资源的集中配置,与当前普遍采用的评价体系相互作用,在客观上加剧了平台空间中传播可见性分配的马太效应。商业平台的算法,其根本目标在于最大化用户停留时长和互动率,这是一个商业驱动的内在逻辑。而来自权威信源的高质量、广谱性内容,天然就具备更强的吸引力和传播势能,因此更容易在算法的筛选和推荐下获得指数级的增长。同时,以平台流量数据为核心的量化考核体系,使流量和数据表现成为衡量媒体融合转型成效的硬指标。中央级媒体凭借其内容、人才和资本优势,能够持续稳定地生产出既符合宣传导向又契合平台算法偏好的爆款内容,从而在主管部门的考核中名列前茅,形成强者愈强、优者更优的循环。
与此形成对比的是,多数地方主流媒体则面临着资源被虹吸的压力。在全国统一的注意力市场中,它们不仅要与资金雄厚的商业化自媒体竞争,更要在同一个赛道上与这些享受着政策与平台双重红利的中央媒体争夺有限的用户时间。换言之,商业平台对中央媒体的持续扶持在巩固主流舆论阵地的同时,也固化了传播资源分配的层级结构,使得腰部和尾部媒体的生存与发展空间受到结构性挤压,加剧了媒体生态内部的竞争与分化。
前述头部效应的直接后果,是占据行业绝大多数的市、县级地方媒体,正承受着一种源自结构性错位的转型压力。这种压力是复合型的,深刻揭示了地方媒体在当前传播格局中的两难处境。其根本困境,在于地方主流媒体的核心职能——服务地方、连接社群的本地性,与当前评价体系促使其追求全网热点和流量数据之间的矛盾。
一方面,作为地方治理体系的重要组成部分,地方媒体的核心使命在于向下扎根,服务地方经济社会发展,传播本土文化,并承担精准进行地方舆论引导的关键职责。这些职能具有鲜明的地域性、服务性和垂直性,其价值主要体现在对特定区域产生的现实影响力上。
然而,在以平台为中心的传播格局下,地方媒体却被推入了一个向上竞争的全国性流量市场。强大的中央级媒体与平台形成的战略联盟构筑了流量高地,使得地方媒体在争夺用户注意力的起跑线上就因其较低的行政层级和有限的政治资本而处于天然劣势,难以获得同等的平台扶持。更为关键的是,一套以流量为核心的评价标准被广泛应用于衡量所有媒体的表现,这为地方媒体制造了一个价值悖论:越是坚守地方定位、深度服务本地社群,其在全国性流量数据上的表现可能就越平庸;反之,若要满足评价体系去追求流量数据,就容易在内容上去本地化,生产更多同质化的网络热点内容,但这又无异于削弱了自身存在的独特价值。
这种两难处境,技术层面上被进一步锁定。在转型压力下,地方媒体动用有限资金采购的标准化技术解决方案,其底层逻辑依然是为流量增长而设计,而非为深度的社区连接和线下服务能力而定制。这使得本应用来构建自身核心能力的宝贵投入,很大程度上变成了支付给技术公司的服务费,非但没有帮助地方媒体打造出体现其本地优势的护城河,反而使其在技术上更加依附于外部通用平台,进一步弱化了差异化发展的战略空间。
媒体深度融合的核心战略目标,是全面提升主流媒体的“传播力、引导力、影响力、公信力”。这是一个内涵丰富、维度多元的综合性概念。然而,在将这一宏观目标转化为具体、可执行的管理实践时,出现了一定程度的实践偏差。
问题的核心在于,对传播效果的衡量方式,在很大程度上倚重了那些易于获取但可能维度单一的外部数据指标。在寻求客观、可比的评价标准时,各级管理部门和媒体机构自身,都自然而然地将目光投向商业平台。毕竟,这些平台是内容分发的主渠道,其后台提供的阅读、播放、点赞、评论、转发乃至热搜排名等数据,因其直观、即时特性,成为评估传播成效最直接的“度量衡”。
这种以平台流量数据为核心的评价体系,深刻地重塑了媒体机构的内容生产逻辑。为了在考核中取得更好成绩,运营团队的工作重心,从传统的“内容价值判断”向“数据增长管理”倾斜,由此加剧了普遍的流量焦虑,并直接导致了一系列连锁反应。首先,在内容选题上,出现了热点化与浅层化倾向。那些能够迅速激发大众情绪、具有高度争议性或娱乐性的社会热点,因其更容易获得算法的推荐和用户的互动,从而成为内容策划时的优先选择。相比之下,那些关乎国计民生但议题严肃、需要深度解读的报道,或是具有地方特色但受众面较窄的内容,则可能因为难以获取大流量不高而被置于次要位置。
其次,在内容呈现上,催生了同质化趋势。为了最大化点击率和完播率,诸如设置悬念的标题党、强化情绪的叙事手法、快节奏的剪辑风格等被市场验证为有效的流量技巧被广泛采纳,导致不同媒体的产品在形态和风格上日趋相似。这种对外部数据的依赖,因媒体技术能力的普遍不足而进一步固化。许多地方媒体,其数字化转型的技术基础本身就是通过采购外部服务实现的。这些由市场化公司提供的技术解决方案,其底层逻辑往往内嵌了对流量指标的首位追求,而缺乏对内容深度、社会效益、用户忠诚度等更多元价值维度的衡量工具。
因此,这种实践偏差并非简单的执行失误,而是一个结构性困境:旨在提升“四力”的顶层设计,在落地过程中,其评价尺度被客观条件窄化为平台所定义的“传播力”,而引导力、影响力、公信力这些更体现媒体核心价值的维度,则在追求“量”的增长过程中面临被弱化的挑战。针对主流媒体的考核体系在事实过程中,政策实施部门强调过“指挥棒”和“度量衡”的关系,清楚阐释了流量和效果的平衡关系——没有流量难说效果,只有流量不等于有效果。具体事实过程的实践偏差,折射出部分地方主流媒体的应对失当,也呼吁着考核体系在发挥积极作用的同时进一步精细化和科学化。
中国语境下的媒体与平台关系,并非纯粹的市场博弈,而是被深刻嵌入一个由国家通过多层次干预机制动态塑造的“国家-市场”双重权力结构中。这种干预或调适机制,超越了西方常见的“事后监管”模式,呈现出贯穿事前、事中、事后全链条的复合型特征。其逻辑并非压制市场,而是通过战略引导、结构塑造、内部嵌入和绩效管理,力图将平台的市场逻辑校准至国家治理轨道,形成一种借力与制衡并存的复杂共生关系。
国家调适机制的首要任务,是从顶层设计上对不同层级主流媒体的核心功能与使命进行清晰界定,从而为构建差异化的评价体系提供根本依据。当前地方媒体的“价值悖论”困境,根源在于“一把尺子量所有”的单一评价维度。
因此,国家需要通过政策文件、行业指南等形式,明确中央、省、市、县四级媒体在全媒体格局中的不同职责定位。例如,中央级媒体的核心职责是围绕党和国家工作大局,设置全国性议程,进行权威政策解读,塑造国家形象,其传播力要求是全国性乃至全球性的。省级主流媒体则应侧重于区域发展战略的宣传、省域内重大政策的传达与解读,以及对下级媒体的业务指导与资源协调。而市、县级主流媒体的核心价值,则要聚焦服务本地社群、精准传达地方政务信息、激活基层社会治理、传承地域文化。
这种职责边界的细化,可从根本上纠正唯流量的导向,使地方媒体的工作重心从追求全网爆款回归到深耕本地上来,让其对地方的实际贡献成为衡量其价值的核心标尺。这不仅是对地方媒体生存价值的再肯定,更是对国家治理体系中基层舆论生态健康发展的战略性布局。
为有效破解平台可见性资源分配的马太效应,国家的调适机制需要超越简单的行政命令,转而采用更具智慧的政策工具,引导商业平台将其资源向省、市级主流媒体进行“精准滴灌”,而非“大水漫灌”。核心在于建立一种正向激励机制:政策应明确鼓励商业平台对那些具有持续优质原创内容生产能力的省、市级主流媒体,予以显著的流量扶持、技术支持和商业合作优先权。这不仅为平台的扶持行为提供了道义基础,也促使地方媒体将精力聚焦于提升内容品质,形成“优质内容-平台扶持-更强能力-更优内容”的良性循环。
政策实施可从两方面着手:一是推动平台优化推荐算法,对用户所在地的本地主流媒体生产的优质内容赋予更高的地域权重,实现“本地人优先看本地新闻”的精准推送。二是鼓励平台建立差异化的扶持体系,将对地方媒体的扶持成效作为其履行社会责任、参与重大项目合作的考量因素之一。
评价体系是引导媒体行为最直接、最有力的指挥棒。国家调适机制的核心突破口,在于推动一场深刻的评价体系革命,用多元、科学的考核指标取代对平台流量数据的单一依赖。这套新的评价体系应紧密围绕前述细化的职责边界来设计。
对于中央和部分省级综合性媒体,全国性传播力(如全网总流量、热搜上榜次数)仍是重要指标,但需补充用户粘性、内容深度、国际传播效果等维度。而对于广大的地方媒体,尤其是市县级媒体,评价的重心必须实现根本性转移。应大力引入能够衡量其本地服务效能的指标,例如“本地用户转化率”(即本地常住人口中有多大比例成为其用户)、“社群互动深度”(如线上社群的活跃度、成员参与感)、“线下服务成效”(如组织社区活动、解决民生问题的案例数量与效果)、“舆论引导精准度”(如在本地关键议题上的引导效果评估)等。这要求考核主体从单纯依赖平台后台数据,转向综合运用第三方调研、用户问卷、专家评审、案例分析等多种方法。
此外,国家可以鼓励有条件的地区先行先试,对市县主流媒体进行分类考核,探索将媒体表现与地方政府的治理绩效、社会满意度等指标进行关联,从而引导地方媒体将资源和精力真正投入到提升本地影响力、公信力的轨道上来,实现从流量驱动向价值驱动的转型。
为主流媒体在平台生态中开拓并巩固其应有的生态位,国家调适机制必须深入到平台运行的核心环节,通过制度化安排重塑内容分发规则,确保权威信息在传播竞争中获得结构性优势。这不仅是为单个媒体赋能,更是对整个网络舆论生态的战略性校准。
建立主流媒体账号流量加权与重点环节管理机制。政策应推动商业平台建立明确的“主流媒体账号流量加权机制”,在算法推荐模型中,对各级主流媒体的官方账号赋予更高的基础权重。同时,这种权重倾斜必须在关键信息节点上得到制度化体现。需完善热搜榜单、弹窗推送、首页首屏等核心公共流量池的管理制度,确保主流媒体发布的重要内容能够在这些关键位置获得优先展示,有效对抗纯市场逻辑下劣质流量对用户注意力的挤占。
健全内容优先推送与关键议题准入机制。在加权的基础上,进一步健全主流媒体发布内容优先推送机制。对于涉及重大政策发布、突发公共事件、重要舆论引导的议题,平台应确保主流媒体的权威声音能够第一时间触达用户。要设立严格的准入标准,从源头上保障核心信息流的权威性。热搜主榜单等具有强大议程设置功能的板块,其推送内容的发布主体必须具有国家认定的新闻采编资质,以将网络空间中最具影响力的议程设置权,回归到具备专业能力和公信力背书的新闻机构手中,防止商业炒作和不实信息占据公共舆论场的核心。
强化主流媒体基于地域的分域精准推送。为精准摆脱地方媒体的结构性困境,必须将流量扶持与媒体的本地职责紧密绑定,推动平台强化主流媒体的分域推送能力。平台可利用地理位置服务(LBS)等技术,优化其推荐逻辑,将区域内省、市、县级主流媒体生产的本地新闻、政务服务与民生信息,精准、优先地推送给该区域的用户。这不仅能极大提升地方媒体对其核心服务人群的触达率和影响力,更能让用户便捷地获取与自身利益最相关的权威信息,从而将平台的流量优势转化为提升基层社会治理效能的实际动力,真正实现“本地人看本地事、关心本地发展”的良性信息循环。
数智时代的算法技术以其强大的数据处理与预测功能,在重塑平台信息生产与分发逻辑的同时,也逐渐成为算法偏见、隐私泄露等问题的风险源,影响社会公平和用户权利的实现。为科学管理算法风险,美国、英国、欧盟和加拿大等国家和地区已出台平台算法审计相关法规与指南。随着《个人信息保护法》《互联网信息服务算法推荐管理规定》关于“合规审计”“算法机制机理审核”等规定的实施,我国基本确立算法审计制度,但缺乏科学标准的流程规范和具体可行的运行机制,导致平台算法审计实践看似有指引,实则难以落地,算法审计的可操作性问题亟待解决。
目前,不少学者从技术、制度等层面研究了算法审计的执行策略。如开发逆推算法,解构算法运行黑箱;确定平台分级数据开放权限,提升算法的可审计性。亦有学者尝试从立法角度提出制定《算法规制法》,将算法审计纳入算法问责框架,根据算法在不同场景中的应用特点、风险程度及规制目标,制定算法审计实施细则或者技术标准。然而,算法审计是一项系统工程,实施过程与决策机制还需要科学理论和方法的支持。
科学的算法审计模型是审计工作的根本保障,更是支撑平台算法治理政策制定的关键。循证决策强调实证思维,用科学精神取代经验方法,能够促进算法审计走向科学、规范。本文将循证决策引入算法审计,构建平台算法审计的循证决策模型,提出平台算法审计的循证路径,进一步完善算法审计制度。
“循证”概念最早来源于临床医学领域。循证医学旨在将研究证据、临床专业技能和患者的价值观与个人偏好三者相结合,以做出科学的临床诊断。随着循证医学向社会科学领域扩散,循证决策应运而生。循证决策主张以经过科学检验的证据为核心进行决策,将证据融入决策的全过程,推动决策更加客观、可靠与科学。其核心理念是运用严密、科学、系统的方法收集高质量证据,避免个体的直觉、情绪、主观判断影响决策的客观性,使决策由主观判断转向证据论证,有利于促进高效、负责任的决策行为。
依据国际标准化组织的定义,“审计”(audit)是一种系统的、独立的、有文件记录的获取证据并对证据进行客观评价的过程。算法审计的本质在于通过获取和分析审计证据,揭示算法风险并提供审计建议,这与循证决策的理念高度契合。将循证决策理论引入平台算法审计,意味着算法审计不再依赖审计者的主观经验或平台的单一陈述,而是转向以证据为驱动的可追溯、可验证的科学过程。其内在嵌合价值主要体现在两个方面:
第一,循证决策能改进算法审计的方法。当前,平台算法审计处于初步发展阶段,审计规范不成熟,表现在审计标准不明、审计方法缺失等方面,导致算法审计实践的经验化与碎片化。循证决策运用专业知识验证决策中的事实因素,强调证据基础、程序规范、科学透明,能够指引算法审计构建可验证、可重复的证据链,使算法审计从经验判断转化为实证推理,保障其客观性与可靠性。
第二,循证决策能为算法审计结论提供事实基础,增强算法审计的公信力。平台算法系统具有一定的自主学习能力,容易引发不确定的算法风险。循证决策以证据为基础,通过收集与审计目标相关的多源证据,为审计结论提供事实依据,降低风险的不确定性,并使审计证据转化为算法治理的依据,为防范算法风险提供指引。同时,循证决策能够确保算法审计过程的可追溯性,在政府部门、平台、公众等各方之间建立信任基础,增强算法审计的可信度。
算法审计是根据一定的规范和标准,对算法开发、部署与运营的全过程进行审查,从而验证算法合规、评估算法风险的活动。循证决策理念主张采取基于证据的科学决策模式。二者具有内在嵌合的独特价值。本文面向算法审计场景,基于循证决策的内在原理与分析模型,构建算法审计的循证决策模型。
循证决策突破传统理性模型,强调“信息”向“证据”的转换。虽然循证决策以证据为中心介质来驱动,但证据是什么、如何得来、决策者如何使用等关键问题尚无定论。基于此,本文将算法审计的循证决策模型划分为证据获取、证据评价、证据转化三个关键要素。证据获取是循证决策的前提,解决“证据是什么、如何得来”的问题;证据评价是循证决策的基础,证据转化是循证决策的关键,二者回答“决策者如何使用”的问题。循证决策要在算法审计中发挥真正作用,必须实现三大要素的有机结合。
证据获取是循证决策的前提,该阶段应明确循证决策需要的证据及其获取方式。在决策科学中,证据是经过加工的支持某一主张正确或有效的信息。证据以确定性为内核,证据的真实性和准确性决定了决策是否准确。
在算法审计中,证据获取也决定着审计结论的真实性。证据主要包括直接证据和间接证据。直接证据是无需额外推理便能指向审计命题本身的核心事实;间接证据不能直接支撑审计命题,但通过阐释、分析、推理等方式能够证明事实真伪。
在直接证据层面,算法审计主要通过算法测试和实验获取证据,其核心目的在于验证算法在真实或模拟环境中的可靠性、有效性和安全性。这种以测试为中心的实验型证据能够为算法审计报告提供事实基础,并辅助监管机构判断平台算法是否合规。算法测试包括两种方法:一是性能测试;二是价值测试。性能测试是验证算法在可靠性、准确性、完备性等方面的性能缺陷。平台内部的算法性能测试一般采用白盒测试,如代码静态检查,借助自动化工具进行扫描与质量评估。价值测试是对算法的公平性、可解释性等进行核查和检验。价值测试主要通过代码审计、抓取审计、马甲审计等方法,穿透算法黑箱,从输入与输出环节检验算法的价值偏见及其对社会不同群体的负面影响。算法审计方法应结合具体问题进行选择。研究表明,代理审计主要用于判断算法是否对特定身份属性存在歧视;抓取审计与众包审计则用于考察算法是否引发信息失真。此外,平台算法审计还可借助AIF360、Fairlearn等开源工具包,对算法的公平性进行自动化检测。
证据评价是循证决策的基础。作为一种对证据进行甄别、定级与筛选的行为,其目的在于剔除低质、失真或无关联证据,获取高质量证据。由于高质量证据在证据的真实性、适当性、有效性方面具有高价值密度,可以帮助决策者减少决策的随意性与主观偏好,进而为理性科学决策提供客观事实基础。
在图1的证据金字塔中,由于专家经验依托个人的专业判断与实践观察,主观性较强、可复现性较弱,位于证据金字塔的最底层,证据质量最低。事实性描述因其所依据的算法日志、公开数据与个案的记录与统计呈现较为客观,更具科学性,但存在缺乏因果关系证明的局限性。社会调研通过深度访谈、问卷调查等方法,获取用户感知与行为数据,具有代表性但多为相关性证据,证据质量相对较高。算法测试基于黑箱测试等实验方法,在控制条件下检验算法输出与偏差,可复现并且证据因果关系明确,能够形成精确的结论和最佳证据,因此证据等级质量最高。
证据的评价标准除了客观性维度之外,还应将真实性、充分性和适当性纳入进来。具体而言,证据的真实性是评价证据来源是否真实、准确和可靠,是否能够支持审计结论;证据的充分性是对证据在数量上的要求,即以最小的审计资源消耗获取足够支撑审计结论的高质量证据;证据的适当性关注匹度问题,即判断证据是否与算法审计的具体事项相匹配,以及证据是否与算法审计的目标和重点高度相关。
证据转化是从信息到证据转化和从证据到政策转化的双向循环过程。内循环侧重证据的生产,即原始信息经过综合分析加工为知识,在检验比对后提炼为可靠的证据,证据再经过价值权衡与利益协调上升为达成共识的判断。在外循环中,证据经政策部门采纳,并转化为治理措施,政策实施过程中形成的新记录和数据将回流至内循环。在算法审计中,证据转化是提升算法审计效能、发挥算法审计价值的重要手段。基于证据转化的内外循环机制,构建“审计证据-审计报告-算法治理政策”的证据转化框架。
第一步,将信息转化为证据。循证决策的关键是通过证据获取和证据评价,将信息转化为高质量的证据,从而支撑证据转化。在证据获取环节,可结合专家经验、事实性描述、社会调研以及算法测试形成初始算法审计证据集,并在一定的标准指导下,对初始证据集进行归纳、加工和整合,为算法审计提供事实依据。在证据评价环节,可通过甄别、定级与筛选等流程,形成不同质量等级的证据条目。经过评价的证据将在算法审计报告中系统、全面地呈现和展示。审计报告既要包括审计目标与范围、结论与整改建议等内容,也需要详实的事实与数据支撑,包括数据样本、测试方法、测试结果等审计标准与方法说明,以便后续审计复现。
第二步,将证据转化为政策。一方面,算法审计者应建立规范的审计结果转化流程,将审计报告传递给平台、算法设计者、算法管理者等主体,督促其加强算法风险测试、调整模型参数、优化决策逻辑或完善算法合规机制等,最终促进算法系统的迭代优化。另一方面,为推动审计证据向政策转化,可将算法审计报告中的经验总结、典型案例,与相关政府机构或行业智库共享,使审计成果成为算法治理的参考依据。同时,算法治理本身会产生新的技术文档、算法运行过程等数据,可储备存档并作为新一轮算法审计的依据,用于验证算法纠偏的实施效果。
循证决策代表一种经验主导向证据主导的决策模式转型,以最佳的科学证据取代直观的经验判断。构建以证据为核心的循证决策机制,需要证据链构建、循证能力提升与证据共享机制的协同作用。三者相辅相成,共同构成动态、可信的算法审计循证实践进路。
在算法审计中,孤证很难有说服力,只有一个证据和另一个证据相互支撑、相互印证,证据与算法审计目标高度匹配,才能具有证据效力。因此,有必要构建不同层次的算法审计证据链,使其成为验证事实是否成立的重要标准。
第一,构建直接证据与间接证据相互印证的证据链。印证是两个以上的证据在所包含的事实信息方面发生了完全重合或部分交叉,使得一个证据的真实性得到了其他证据的验证。直接证据和间接证据等不同类型的证据之间能在相互印证中,探究是否存在矛盾,从而验证事实的真伪。以算法偏见的审计为例,直接证据可以通过穿透算法黑箱,从算法输入与算法输出的测试中获得;间接证据包括专家对平台算法是否存在偏见的经验判断、用户的投诉和评论中关于对算法偏见的主观感知等。算法审计者可以在直接证据与间接证据之间构建证据关联,使两类证据形成互补结构,提升审计结论的内在说服力。
第二,根据风险的归因逻辑构建证据链。将风险生成来源分成不同类别,并据此收集不同的证据,使其从各个角度支撑算法审计结论。以算法的偏见审计为例,证据可以从数据层、模型层与设计者层获取。数据层关注训练数据集中是否存在样本缺失、代表性不足等问题;模型层则聚焦模型运行日志、调整记录、测试过程等方面,收集是否放大算法偏差的证据;设计者层则考虑函数设定、权重选择等是否存在价值偏好或流量导向。算法审计可以将这三类证据串联,推断算法偏见形成的因果链条,使不同层面的证据能够针对同一问题实现交叉验证。
第三,构建审计前和审计后相对比的证据链。由于算法审计的最终目的是纠正算法偏差,因此证据链必须包含算法审计前的“问题证据”与算法审计后的“效果证据”。将审计前的“问题证据”作为算法风险的基线,审计后的“效果证据”作为算法纠偏或干预后的效果证明,并将二者进行对比,验证风险归因的准确性,同时验证平台算法纠偏的有效性、技术干预是否带来新的偏差,实现审计结论的可验证性。
算法审计者还应加强人机协同审计能力,借助人工智能技术的力量辅助循证,利用人工智能技术实现“采集-处理-建构”的一体化证据获取与评价体系,提升算法审计效率。AI能够以智能分析为核心实现知识发现。基于机器学习、深度学习等技术,人工智能可以在广泛挖掘数据的基础上,从复杂数据中自动发现隐含的知识、模式和规律,并生成新的知识。基于此,算法审计者可以利用智能技术将算法测试等直接证据中的显性知识进行自动化、规模化提炼,并对社会调研、访谈、专家经验中的隐性知识进行捕捉,帮助理解证据与审计目标之间的关联。同时,算法审计者可以将证据金字塔标准输入给智能技术,使其结合不同的审计情境,生成差异化的证据评价模型,选取与审计目标高度匹配的证据。
审计证据共享机制是将审计证据集中化存储,使作为信息的证据转化为知识,促进形成科学的算法审计证据体系。建立审计证据共享机制应从两方面着手,一方面,加强审计机构内部的证据资源库建设。证据资源库的目的在于实现证据的合理储存与管理。具体而言,证据资源库建设需要整合算法审计获取的多样化证据,包括社会调研与访谈内容、典型案例、量化数据等,形成证据分级分类清晰的类型化证据集和知识库,并动态更新证据,形成可回溯的证据链。同时,建立证据质量控制体系,制定证据质量监督程序。高质量信息应满足两个条件,一是在客观上符合信息质量规范,二是在主观上满足主体的适用期望。从证据来源角度,应建立信息入库质量管理制度,确保证据来源的真实性、有效性与适用性,为算法审计决策提供高质量的证据支持。
另一方面,建立跨部门、跨领域的证据共享网络。为了打破不同机构之间的信息壁垒,应建立算法审计证据共享通道,与行业智库、标准化组织以及监管机构共享审计证据。传统的信息共享模式依赖中心化存储结构,容易产生数据孤岛、商业秘密泄露等风险,难以实现跨部门、跨平台的审计协作。利用区块链技术中的哈希证明机制,在保护企业商业机密和数据隐私的前提下,实现跨机构的证据数据共享。哈希证明机制是一种利用密码学哈希函数特性的数据证明方式,通过提交文件的哈希值(如0x1a2b),在满足数据隐私与存储效率的条件下,对文件是否存在、有无篡改进行验证。具体而言,将审计结果、典型案例等关键数据以哈希值的方式分布式存放于不同节点,可以实现网络节点参与者的监督。监管机构、行业智库等其他组织对区块链上的交易数据进行验证,核查证据是否被篡改,辅助验证算法审计结果的真实性,促进算法审计体系的透明化和规范化。同时,推进审计机构不同部门之间的互联互通、资源共享,通过联合证据分析,提高证据的使用效率。通过建立统一的算法治理证据平台,由监管部门、第三方机构和行业组织共同参与,形成多源证据共用机制,使不同部门在统一的信息基础上开展政策协同,提升政策一致性。
算法审计是验证算法合规、评估算法风险的重要治理工具。然而,平台算法审计仍存在审计标准不清、审计流程不明等问题。将基于证据的循证决策嵌入算法审计,可以促进审计决策从经验导向转向证据导向,有利于提升算法审计的科学性、规范性与可验证性。本文创新性地借鉴循证决策的理念与机制,以“证据获取—证据评价—证据转化”为循证框架,构建证据链,提升循证能力,实现证据共享。算法审计是一个动态性和情境化的活动,随着人工智能与计算社会科学的发展,未来也可以从循证决策视角出发开展更多实证研究,探索面向不同平台和算法应用类型的情境化算法审计机制,构建公平、透明、可信的算法治理体系。
