該標準規(guī)定了電力人工智能平臺樣本規(guī)范的相關內(nèi)容,規(guī)范了人工智能圖像視頻、語音、文本類樣本的樣本基本要求、樣本標注要求和樣本標注流程,解決為提高樣本標注質(zhì)量、統(tǒng)一樣本標注規(guī)范等問題。
起草單位為國網(wǎng)信息通信產(chǎn)業(yè)集團有限公司、福建億榕信息技術有限公司、北京國網(wǎng)信通埃森哲信息技術有限公司、安徽繼遠軟件有限公司、國網(wǎng)重慶市電力公司電力科學研究院、四川大學、四川中電啟明星信息技術有限公司、國網(wǎng)重慶市電力公司、中國電力科學研究院有限公司、國網(wǎng)四川省電力公司、國家電網(wǎng)有限公司大數(shù)據(jù)中心
主要起草人為李強、邱鎮(zhèn)、趙峰、劉迪、廖逍、李炳森、黃曉光、劉永清、向輝、許中平、蘇少春、楊迎春、周孔均、王曉東、鐘加勇、彭艦、王秋琳、黃飛虎、王金策、田鵬、呂小紅、厲仄平、蘇江文、費長順、宋衛(wèi)平、趙燦燦、張琳瑜、崔迎寶、劉璟、盧大偉、劉園園、宮曉輝、尹玉、周偉、王蓓、梁翀、李溫靜、王衛(wèi)衛(wèi)、伍臣周、王曉輝、陳振宇、郭慶、浦正國
人工智能技術成為推動能源互聯(lián)網(wǎng)創(chuàng)新發(fā)展的關鍵核心技術,為公司電網(wǎng)調(diào)度、運維檢修及分析決策等提供智能分析支持,在電網(wǎng)生產(chǎn)、經(jīng)營管理和優(yōu)質(zhì)服務三大領域日益廣泛應用。樣本標注是人工智能模型訓練中至關重要的一環(huán),為提高樣本標注質(zhì)量、統(tǒng)一樣本標注規(guī)范,開展人工智能樣本標注規(guī)范研究。明確樣本基本要求、樣本標注要求和樣本標注流程,為公司人工智能樣本標注工作開展提供指導規(guī)范。
從內(nèi)容上來看,該標準主要包含以下幾個部分:
(1)范圍
包括規(guī)定了人工智能樣本的基本要求、標注要求、標注流程,其中人工智能樣本類型包括圖像視頻、語音和文本。適用于人工智能平臺樣本庫的規(guī)劃、設計、開發(fā)、建設和運維。
(2)規(guī)范性引用文件
(3)術語和定義
包括人工智能基本概念與專家系統(tǒng)、人工智能面向機器學習的數(shù)據(jù)標注規(guī)程、信息處理用現(xiàn)代漢語分詞規(guī)范、人工智能語音識別與合成的定義。
(4)縮略語
(5)樣本基本要求
包括規(guī)范了人工智能圖像(含視頻)、語音、文本類樣本數(shù)據(jù)基本要求、樣本標注要求和樣本標注流程,樣本標注后匯總到電力人工智能平臺中進行管理。
(6)樣本標注流程
包括樣本標注流程有:樣本檢查、標注工具選擇、標注任務開展、標注結(jié)果收集和標注結(jié)果檢查等環(huán)節(jié)。
該標準規(guī)范了電力人工智能平臺樣本規(guī)范要求,該標準效益主要體現(xiàn)在:
(1)提高樣本標注質(zhì)量、統(tǒng)一樣本標注規(guī)范。規(guī)定了電力人工智能平臺樣本規(guī)范的相關內(nèi)容,規(guī)范了人工智能圖像視頻、語音、文本類樣本的樣本基本要求、樣本標注要求和樣本標注流程,解決為提高樣本標注質(zhì)量、統(tǒng)一樣本標注規(guī)范等問題。
(2)推動算法模型研發(fā)、共享。電力行業(yè)人工智能樣本規(guī)范將具備更具針對性的評價應用,可以推動電力行業(yè)人工智能算法模型的規(guī)范化研發(fā)、共享。形成更加高效、安全的電力人工智能樣本體系。促進電力行業(yè)人工智能技術深化應用于發(fā)展。