時間:2023-11-15 來源:合肥網hfw.cc 作者:hfw.cc 我要糾錯
科學技術發展是一把雙刃劍。作為時代的產物,人工智能的出現推動社會發展進入一個全新階段,另一方面,人工智能技術的濫用或非誠信使用,又會給社會造成很多負面影響。其中,以AIGC為代表的人工智能技術在科研領域的濫用,就會抑制真正的科研創新。
AIGC技術可以通過排列組織預訓練數據生成文本、圖像、數據、代碼、視頻等,這些內容可能會形成論文或項目申請書,存在觀點剽竊等隱患,也極易引發新形式的論文代寫、抄襲剽竊、洗稿等學術不端行為。根據Retraction Watch的數據統計,自2021年截止到2023年7月6日共有914篇因“Randomly Generated Content(隨機生成的內容)”原因被撤稿,約占近三年來撤稿論文總數的8.34%。
由于當下的AIGC技術生成內容無法明確知識來源,加上更加隱蔽的虛假數據“成果”,洗稿、新形式的論文代寫等學術不端行為,原有的相似度查重和圖像識別等技術逐漸失效,加大了識別這些學術不端行為的難度,對科研誠信提出了新的挑戰。
基于當前新時代下論文學術不端的治理需求,萬方數據推出科技論文誠信風險綜合察驗服務——萬方文察。該工具基于萬方數據文本檢測、圖像檢測等核心技術及科研誠信大數據資源基礎,實現對論文的文本相似性、圖像復用、AIGC文本、引文及作者等多要素的失信風險一站式綜合察驗,為教育、科研、出版、管理等誠信監管工作提供便捷服務支撐。
萬方文察服務采用多項關鍵技術為技術支撐,基于海量科技文獻全文比對資源、科研誠信風險大數據資源、學術文獻圖像比對庫等資源為大數據底座,可支持在線云服務及API接口服務等服務形式,實現“一次提交、多維檢測”的一站式論文風險察驗服務。
在AIGC文本檢測方面,萬方文察服務采用基于深度學習的AIGC識別算法,基于卷積神經網絡的強大表達能力,智能感知生成和非生成文本之間的差異,可識別目前較為通用的AI寫作模型,包括不限于ChatGPT、文心一言、GTP3.5、谷歌Bard、通義千問、必應ChatGpt、ChatSonic和其他AI寫作助手生成的中文文本。
除此之外,萬方文察服務還可提供論文圖像檢測、文本相似性檢測以及參考文獻、作者、基金資助等論文屬性風險檢測。
人工智能時代,學術不端更具隱蔽性,形式也多種多樣,給風險察驗帶來了很大的挑戰。萬方文察“以科技打敗科技”,讓論文中的AIGC文本無處遁形,全方面推動科研誠信建設。