人工智能技術(shù)正
應(yīng)用到各個行業(yè)當中,并對推動人類科技經(jīng)濟發(fā)展起著加速作用。麥肯錫全球研究所(McKinsey Global Institute)的一項預(yù)測顯示,隨著人工智能技術(shù)越來越成熟,能力越來越強,預(yù)計它將極大地推動世界經(jīng)濟,到2030年將創(chuàng)造約13萬億美元的附加價值。
作為
人工智能產(chǎn)業(yè)的內(nèi)部驅(qū)動力,數(shù)據(jù)、算法和算力三大要素對人工智能技術(shù)的升級發(fā)展至關(guān)重要。當下,人工智能正加速往應(yīng)用人工智能方向發(fā)展,在算法、算力沒有重大突破的前提下,質(zhì)量高和安全性強的數(shù)據(jù)成為人工智能商業(yè)化落地的關(guān)鍵點。
以醫(yī)療行業(yè)為例,醫(yī)生是個專業(yè)壁壘極高的職業(yè),但隨著人工智能的不斷成熟,AI數(shù)據(jù)的專業(yè)性和精確度的不斷提高,如果醫(yī)療方向的人工智能技術(shù)接受了足夠多且精準的醫(yī)療領(lǐng)域數(shù)據(jù)的訓(xùn)練,學(xué)會了海量的醫(yī)療知識,那么醫(yī)生就可以借助人工智能的幫助,更好的解決疾病困難。
可以說,在
人工智能體系中,承載著整個體系之重的AI數(shù)據(jù)具有不可估量的價值作用。
對于這個無法衡量的價值意義,國內(nèi)頭部AI數(shù)據(jù)采集標注企業(yè)云測數(shù)據(jù)認為:“AI數(shù)據(jù)在整個人工智能各個領(lǐng)域扮演著“源動力”的角色,可以說數(shù)據(jù)標注的質(zhì)量決定了現(xiàn)階段人工智能的落地水平。高質(zhì)量的AI數(shù)據(jù)可以幫助人工智能加速商業(yè)化、落地化、產(chǎn)業(yè)化進程。”
并非有意此言之,這是基于云測數(shù)據(jù)的實踐成果——云測數(shù)據(jù)通過自建數(shù)據(jù)交付中心和數(shù)據(jù)場景實驗室,為眾多AI企業(yè)或傳統(tǒng)企業(yè)智能化提供了高質(zhì)量、場景化的數(shù)據(jù),這些高質(zhì)量的數(shù)據(jù)服務(wù)為AI產(chǎn)業(yè)化進程起到了重要助推作用。
云測數(shù)據(jù)一直專注于為業(yè)界提供高質(zhì)量、高標準的
AI數(shù)據(jù)采集標注服務(wù),在客戶、媒體等圈層獲得了諸多認可,是業(yè)內(nèi)極具實力和代表性的AI數(shù)據(jù)采集、數(shù)據(jù)標注資源服務(wù)商。
在今年9月舉辦的中國國際服務(wù)貿(mào)易交易會上,云測數(shù)據(jù)進行了“項目最高交付精確度達99.99%”的成果發(fā)布,這是目前數(shù)據(jù)標注領(lǐng)域可達到的最高服務(wù)標準,也是一個創(chuàng)紀錄的數(shù)字,建立了數(shù)據(jù)標注行業(yè)的一個全新標準,昭示AI領(lǐng)域已經(jīng)進入到新的發(fā)展時代。
數(shù)據(jù)精細化服務(wù)時代已然開啟
《2019年中國人工智能年度專題研究報告》指出,全球數(shù)據(jù)量已達到ZB級別(1ZB約為10億GB)的大數(shù)據(jù)時代,為人工智能技術(shù)進步提供了充足的養(yǎng)料。但大量的數(shù)據(jù)對算法、算力也提出了較大挑戰(zhàn),如何更好的挖掘和清洗出有效數(shù)據(jù),成為產(chǎn)業(yè)進一步發(fā)展的關(guān)鍵。
隨著
人工智能在各個行業(yè)的逐漸落地,對數(shù)據(jù)精準程度要求正在變得越來越高,對數(shù)據(jù)維度和樣本復(fù)雜性的需求也越來越高,對數(shù)據(jù)標注技術(shù)、標注平臺能力、不同場景數(shù)據(jù)協(xié)同標記難度越來越復(fù)雜。云測數(shù)據(jù)所做的就是通過自建數(shù)據(jù)場景實驗室和數(shù)據(jù)標注基地,為智能駕駛、智慧城市、智能家居、智慧金融、新零售等各個領(lǐng)域提供場景化的高質(zhì)量數(shù)據(jù)采集、數(shù)據(jù)標注服務(wù)。云測數(shù)據(jù)通過自研的數(shù)據(jù)標注平臺、數(shù)據(jù)采集系統(tǒng)和完善的數(shù)據(jù)生產(chǎn)流程等,并通過專業(yè)的項目經(jīng)理來把控每一個AI數(shù)據(jù)的精準,以保證數(shù)據(jù)的效率、精準度。
高效率保證AI研發(fā)周期
企業(yè)的
智能化是一個不斷突破的過程,從算法到模型再到驗證也是一個螺旋上升的過程,這個過程對數(shù)據(jù)標注數(shù)量需求也是呈現(xiàn)波段性的。
出于成本最優(yōu)角度考慮,企業(yè)本身不會長期配置專門的大量標注師的崗位來處理龐大的數(shù)據(jù)樣本供機器學(xué)習(xí)。然而一個熟練的數(shù)據(jù)標注師需要經(jīng)過至少2-3個月的持續(xù)培訓(xùn)和訓(xùn)練,當企業(yè)需要大量數(shù)據(jù)標注的時候有可能已經(jīng)來不及培養(yǎng)。而且今天人工智能的數(shù)據(jù)服務(wù)需求,依然不夠標準化,每個項目的需求可能都是獨一無二的。云測數(shù)據(jù)已經(jīng)服務(wù)了各行各業(yè)的大量客戶,在執(zhí)行各種需求的過程中積累了大量的經(jīng)驗,可以說數(shù)據(jù)采集標注能力已經(jīng)十分成熟。通過高效的AI數(shù)據(jù)流轉(zhuǎn)過程,在保證數(shù)據(jù)精準的前提下,完善的幫助企業(yè)解決AI數(shù)據(jù)效率需求。
數(shù)據(jù)獨立安全,方能建立AI企業(yè)的核心數(shù)據(jù)壁壘
一個獨立第三方的身份,可以很好地幫助AI企業(yè)或傳統(tǒng)企業(yè)智能化轉(zhuǎn)型,建立自己的核心數(shù)據(jù)壁壘優(yōu)勢。
云測數(shù)據(jù)一直把數(shù)據(jù)安全作為前置底線,包括:第一,不濫用數(shù)據(jù),數(shù)據(jù)交付后清毀數(shù)據(jù)不留底,絕不二次使用;第二,不侵犯隱私,與所有數(shù)據(jù)采集的用戶都簽訂數(shù)據(jù)授權(quán)協(xié)議,確保AI企業(yè)用于訓(xùn)練的數(shù)據(jù)合法合規(guī);第三,建立相關(guān)的數(shù)據(jù)保障機制,如從防火墻的設(shè)置、內(nèi)部信息系統(tǒng)的管護乃至標準化的流程作業(yè)體系等等。
在云測數(shù)據(jù)看來,
人工智能最終是為了被使用,所以對人工智能的數(shù)據(jù)質(zhì)量要求會越來越高、越來越準確,在場景中會出現(xiàn)更多的定制數(shù)據(jù)需求,除了提高數(shù)據(jù)安全性和隱私保護外,正如前文所說的,要保證數(shù)據(jù)的唯一性、高質(zhì)量、場景性,才能真正幫助企業(yè)建立數(shù)據(jù)核心壁壘。
在人工智能領(lǐng)域,有著“成也數(shù)據(jù),敗也數(shù)據(jù)”的說法。而在大數(shù)據(jù)時代,隨著AI產(chǎn)品逐漸的落地,除去“大”和“多”兩個關(guān)鍵詞,“精準”成為了更重要的衡量維度。對于人工智能應(yīng)用來說,AI數(shù)據(jù)的精準度失之毫厘則差之千里,而在人工智能應(yīng)用落地的過程中,AI數(shù)據(jù)精準度的差異會愈發(fā)的明顯。畢竟,人工智能技術(shù)發(fā)展的瓶頸已經(jīng)在逐漸打破,落地實用將成為行業(yè)的下一個挑戰(zhàn)。高精準度、高質(zhì)量的AI數(shù)據(jù),將助力
人工智能應(yīng)用具備更強大的服務(wù)能力,走進千家萬戶的現(xiàn)實生活。