當前,我國數字經濟進入快速發展新階段,數據作為新型生產要素,已成為推動經濟社會高質量發展的核心驅動力。構建完善的數據要素市場體系,核心議題之一在于建立數據的合理定價機制與有效激勵機制。
國家層面已為此提供了清晰的制度指引。《關于構建數據基礎制度更好發揮數據要素作用的意見》(“數據二十條”)明確提出,要建立體現效率、促進公平的數據要素收益分配制度,并特別強調“按價值貢獻參與分配”。與此同時,《關于深入實施“人工智能+”行動的意見》進一步突出了高質量數據在人工智能發展中的基礎支撐作用。隨著人工智能發展范式從“以模型為中心”轉向“以數據為中心”,數據質量已成為決定AI系統能力上限的關鍵變量。然而,當前高質量數據的供給仍面臨定價機制不健全、市場化激勵不足等現實挑戰。因此,積極推動“為優質數據付費買單”,不僅是破解數據要素市場化配置瓶頸的迫切需要,更是激活數據潛能、支撐人工智能產業創新發展的重要戰略舉措。
確立數據付費機制的必要性
當前數據要素市場發展的核心障礙,在于缺乏一套能夠精準識別并回報數據價值的付費機制。這不僅是一個定價問題,更是一個導致市場失靈、抑制創新并危及人工智能產業健康發展的系統性困境。
一是市場機制待破解,優質數據流通受阻。市場面臨的根本性難題是“雙向價值不確定性”與定價失靈。數據供給方無法預知其數據將被如何復用及創造多大價值,而需求方在交易前也難以驗證數據質量及其對模型的確切貢獻。這種深度信息不對稱,使得高價值數據的持有者因擔心無法獲得公平回報且面臨泄漏風險而選擇“惜售”,導致高價值、差異性數據資源的有效供給不足。其結果是,“檸檬市場”效應開始顯現:劣質數據將會擠壓優質數據的生存空間,不僅抑制了市場對高成本、高價值數據產品的有效需求與合理定價,也最終會導致數據要素的配置效率低下。
二是供給端激勵不足,高質量數據“產能”缺失。付費機制的缺位,導致市場缺乏對高質量數據生產的有效激勵。例如專業數據集(如醫療、科研、工業)的構建依賴專家知識和高成本標注,但由于其貢獻難以被市場量化并給予匹配回報,導致相關主體缺乏持續投入的積極性。這造成支撐產業深度智能化的高質量、專業化數據集嚴重供給不足,成為制約人工智能向縱深發展的瓶頸。
三是需求端被迫妥協,模型與產業根基受損。在優質數據供給不足且缺乏合理定價的背景下,人工智能研發將會被迫轉向大量免費但噪聲大的開源網絡數據。這類數據往往包含諸多錯誤與偏見,用于訓練模型不僅效率低,還可能引發“模型自噬障礙”,導致模型輸出事實錯誤或性能退化。長期如此,產業易陷入“低質數據訓練低能模型”的循環,制約技術進步與可靠應用。此外,付費機制的缺失也不利于培育基于數據深度加工、可信協作的創新商業模式,限制了數據生態的活力與多樣性。
建立科學的數據付費機制,是構建可持續數據要素市場的基礎。這不僅是為了保障數據供給方的合法權益、明確權益歸屬,更是為了通過建立規范透明的價值實現渠道,穩定市場預期、促進數據高效合規流通,從而充分釋放數據要素的價值,有效賦能數字經濟發展。
破局之道:構建技術驅動與機制保障的數據付費體系
擺脫前述困境,關鍵在于構建一套技術驅動、制度保障的數據付費體系。這需要圍繞“技術量化價值、機制保障分配”的核心思路展開,從技術路徑、體系構建與實踐借鑒三個層面系統推進。
一是技術路徑上,從“模糊定價”走向“精準量化”。破解數據定價難題,首先要基于前沿技術實現從主觀經驗判斷到客觀貢獻度量的根本轉變。傳統定價方式已難以適應數據,尤其是人工智能訓練數據所特有的價值不確定性、場景依賴性和事后驗證性。
破局需要發展并融合兩類關鍵技術:一是基于貢獻認定的價值量化技術,其核心是運用合作博弈理論等方法,通過計算特定數據對模型性能提升的平均邊際貢獻,為公平收益分配提供客觀的量化依據;二是面向規模化應用的智能評估系統,能夠對海量數據進行自動化質量篩查與價值預判,實現“算法優化數據輸入”,從源頭提升數據質量與訓練效率。
二是體系構建上,以基礎設施為載體,落實數據賬單與激勵機。技術路徑解決了價值“如何量化”的問題,而要將這一客觀依據轉化為有效激勵,則必須將其有機融入新型數據基礎設施與制度設計。
當前,我國推進的可信數據空間等基礎設施,在保障數據安全合規流通的基礎上,應進一步升級為“綜合價值樞紐”。這需要在基礎設施中深度集成數據價值評估與基于貢獻度的收益分配模塊,使數據在流通過程中同步完成價值認定與收益清算,從而系統性化解交易中的信息不對稱與信任難題。
這一升級的核心體現,是構建依托基礎設施的“數據賬單”體系。該體系需兼顧成本合理補償與收益公平分享,在成本側,可借助數據資產圖譜等技術,建立透明可信的成本歸集機制;在收益側,應嚴格遵循“貢獻決定報酬”原則,在具體應用場景中依據客觀評估的貢獻度,自動執行收益的精準計算與分配,生成各方可核驗的可信賬單,從而構建持續激勵高質量數據供給的正向循環。
此外,國際上在數據協作與付費機制方面的先行探索,為我國構建自身體系提供了寶貴的實踐參考,印證了相關技術路徑與機制設計的必要性與可行性。
攜手共建數據價值充分釋放的新格局
為優質數據建立科學的付費機制,是對數字經濟發展未來和人工智能產業健康成長的戰略性、長期性投資。構建一套公平、有效的數據評估與計價體系,是破解“檸檬市場”效應和“雙向價值不確定性”難題的根本路徑。
基于貢獻度評估的定價與收益分配機制,為貫徹落實“數據二十條”精神提供了清晰可行的技術方案。通過在新型數據基礎設施中系統性集成價值評估功能,建立可追溯成本、可量化貢獻、可公平分配收益的“數據賬單”體系,能夠有力促進高質量數據的持續供給與高效配置,為深入實施“人工智能+”行動奠定堅實的數據基礎。
期待社會各界進一步凝聚共識,將數據資源的戰略性投入視同關鍵技術的研發投入,共同推動基于貢獻度評估的定價與收益分配體系的建設與應用。以此,充分釋放數據要素潛能,使其真正成為發展新質生產力、驅動經濟社會高質量發展的核心引擎,攜手共同邁向數據價值充分涌流、數字經濟繁榮發展的新時代。(作者系清華大學交叉信息核心技術研究院常務副院長)
(人民網記者許維娜 整理)
【相關閱讀】
之一:建立優質數據付費流通機制 推動高質量數據價值釋放