海天瑞聲:專注AI數據,為千行百業數字化轉型賦能
11月8-10日,2023年世界互聯網大會在浙江烏鎮舉行。海天瑞聲創始人、董事長賀琳受邀接受浙江日報-潮新聞的專訪。
隨著AI特別是大模型技術不斷發展,AI將更加融入人們的日常生活。作為我國最早一批深耕AI數據行業、并成為本行業首家在主板上市的公司,海天瑞聲亮相世界互聯網大會“互聯網之光”博覽會。
作為行業標桿,深耕行業近20年的海天瑞聲,正向全行業提供多語言、跨領域、跨模態的人工智能數據及相關數據服務,涵蓋智能語音(語音識別、語音合成)、計算機視覺、自然語言等多個核心領域,覆蓋全球70多個國家、超過200個主要語種及方言。
海天瑞聲與阿里巴巴、騰訊、百度、科大訊飛、海康威視、字節跳動、微軟、亞馬遜、三星、中國科學院、清華大學等全球近900家科技互聯網、社交、IoT、智能駕駛等領域的主流企業,以及教育科研機構等建立了深度合作關系,以專業、可靠、安全的數據服務,成功交付數千個定制項目。
今年開始,全球掀起百模大戰,以ChatGPT為代表的大模型產品不斷涌現,提到大模型相關的布局,海天瑞聲創始人、董事長賀琳在接受潮新聞記者采訪時介紹道,“我們已經攜手大模型企業及科研機構,包括中國科學院自動化所、信通院泰爾實驗室、智譜AI、瀾舟科技等,共同打造中文大模型高質量數據集,來推動大模型技術的發展。我們也在準備圍繞著大模型的需求,開放一批數據集用于大模型的開發、評測,包括舉辦一些競賽”。
在2023中國計算機大會 (CNCC) 上,智譜AI推出了全自研第三代基座大模型 ChatGLM3及相關系列產品,海天瑞聲成為智譜AI數據伙伴,為AI未來創新和行業發展攜手合作。
賀琳表示,“業界已經形成高度共識,數據和人工智能的關系是密不可分的。大家都知道算力、數據和算法是人工智能的三駕馬車??赡芩懔Υ蠹叶急容^了解了,就是計算的能力。那算法跟數據的關系,我們會有一個比喻,就像是一個孩子生下來,他有大腦、有思考能力,這就是算力、算法的作用。但是他其實對這個世界沒有任何認知,因為他沒有經過知識的獲取和學習。數據相當于是知識,我們要用教科書的形式賦予大腦更多的能力。做數據其實就像是做教科書,教科書越好,大腦學到的知識就越豐富越全面,所以我們做數據就是要努力把這些知識做得更全面更優質,讓大腦學會更多的內容,可以去做更多的事情。”
另外,海天瑞聲在“互聯網之光”博覽會重磅推出DOTS-LLM大模型服務平臺,平臺包括數據采標、數據管理、模型訓練和模型評測四大功能,旨在為千行百業數字化轉型賦能。海天瑞聲CTO黃宇凱向潮新聞記者介紹道。
據了解,海天瑞聲圍繞大模型方向的最新布局,已經發布了IPO后首次定增計劃。
賀琳介紹說,我們會從兩個方向發展大模型業務。一個是堅持現有的商業模式的一大特色,做標準化的數據集產品,一次性投入建設,滿足市場上大模型訓練、調優、評測需求,這不僅會為海天瑞聲帶來規模化收益,也將解決我國大模型目前面臨的數據痛點。
另外一個方向則是,海天瑞聲將基于在深度學習階段數據集生產所積累的know-how,自主研發數據生產垂直大模型,構建大模型數據處理技術通用化解決方案能力,實現完整、可持續迭代的大模型數據技術框架和數據策略,進一步提高公司在人工智能基礎數據服務領域的智能化水平,鞏固公司的核心技術壁壘,形成長期技術實力支撐。
當前,海天瑞聲擁有專業的數據采標團隊,深入理解各種應用場景的需求。可提供高精度的數據清洗服務,確保數據的準確性和一致性,為客戶的大模型訓練提供高質量的數據基礎。海天瑞聲為國際質量管理體系 (ISO9001) 和數據安全體系 (ISO27001、ISO27701) 認證企業,并擁有行業領先的技術平臺來保證數據標注的準確性,同時也提供近1500個高質量自有知識產權的數據集供客戶選擇,涵蓋多個場景、多個環境、多種形式、多樣的采集設備和多元化被采集目標,全方位助力AI前沿項目的全球商業落地。
除了開發通用領域的數據資源以外,海天瑞聲也已經向垂直行業展開布局,提供垂直行業數據解決方案。公司今年上半年已經發布了DOTS-AD自動駕駛平臺,這是一個專門為自動駕駛打造的數據處理平臺。未來,海天瑞聲將持續在人工智能數據領域深耕細作,以優質的數據和專業的服務,助力大模型技術的不斷發展和創新,為千行百業的數字化轉型貢獻力量。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。
標簽:


