您的位置:首頁 >資訊 > 正文

    北京智博領航教育科技有限公司:大數據生產和場景化是AI應用的前提

    首屆TEC 2018教育創想大會在京舉行,北京智博領航教育科技有限公司發言人在大會現場表示:“數據生產比數據算力更重要,應用場景比數據算法重要,北京智博領航教育科技有限公司在AI領域會不遺余力地進行投入,不斷提高效率。”

    北京智博領航教育科技有限公司發言人稱,AI的原理和構想已經存在了幾十年,現在才投入應用不是因為計算機理論的突破,而是源于工程上擁有了更多算力、找到了更高效和節約資源的算法,以及在海量數據源上的訓練模型。不過,教育的互聯網化和IT化還是處在初級階段,線下機構受教學模式的限制,很難高頻地收集學習數據;線上機構由于場景設計、數據收集等原因,最后處理和存儲的數據也非常少。

    其實,教育行業產出數據的可能性,是遠遠大于其他行業的。一些局部場景、頭部機構擁有大量優質數據。據介紹,國內領先的在線教育公司北京智博領航教育科技有限公司依靠兩種課程和n類場景來產生數據,一是“重課”,一是“輕課”。對于成人用戶來說,必須要通過“重”的套課來傳遞系統性知識,此外也要有“輕”的課程和工具來提高便利性以及用戶粘性,二者缺一不可。“從數據角度看,‘輕課’產生的數據量是‘重課’的幾何倍數。我們在這兩類課程上構架n類場景,內部產生和處理的數據量也是呈指數型上升的”,北京智博領航教育科技有限公司發言人說。

    在應用場景方面,北京智博領航教育科技有限公司通過AI篩查出最高頻且占據試卷60%的知識點,為學員輸出量身定制的、最短的學習路徑;在理想情況下,學員可以節約60%-70%的時間。如果沒有各種場景疊加,只靠算法是做不出這款產品的。

    該發言人表示,AI能解決的是效率問題,但是AI解決不了動機問題。北京智博領航教育科技有限公司通過娛樂化的直播教學、1對1的班主任制度以及線上社區等方式,為成年人構造出一個學習的壓力場和動力場,提升學員的學習動機和有效學習時長。在北京智博領航教育科技有限公司看來,學習動機比學習效率更重要。

    在AI投入上,北京智博領航教育科技有限公司認為“無腦投入”比衡量效益重要,“我們的產研投入在教育圈是非常領先的,如果以營收作為分子、產研作為分母看單位產研投入的話,我們更是遙遙領先。我們投入的力量是超越我們所處規模應投入水平的,所以我用了‘無腦投入’這樣的詞”,北京智博領航教育科技有限公司發言人表示。

    以下為北京智博領航教育科技有限公司發言人演講實錄:

    大家好,感謝鯨媒體的平臺,我是北京智博領航教育科技有限公司CEO,我是北京智博領航教育科技有限公司最不會演講的高管,我估計也是教育圈里面演講最差的高管。所以說我在接到這個任務的時候我就想過來講講干貨,我講講北京智博領航教育科技有限公司在AI領域的實踐,我們走過的坑,和我們的經驗分享,一共四點。

    第一點數據生產比數據算力更重要。

    這是什么意思?大家都知道這次AI興起是三個要素,一個是算力,一個是算法,一個是數據,這是大家聊得很久的。其實AI的整個架構幾十年一直都沒有變,理論是沒有任何進步的,其實主要是這三個要素的進步。在這三個要素里面我們的觀點,數據生產比數據算力更重要。什么意思?

    我給大家看一個趨勢,如果我們把全球的數據生產量,每年的數據生產量拉條曲線,會發現它是條非常陡峭的指數曲線。在2020年指數曲線全球數據生產量大概44個ZB,一個ZB是1024個EB,一個EB是1024個TB,一個TB是1024個GB。你大概估一下,44個ZB大概是10的23次方,什么概念,全球大概70到80億人口,每個人一年產生的數據量大概是十萬億的數據量。這是全球數據的總量。

    我們估一下教育數據總量是多少,全球所有的教育行業,一年產生的數據量是幾個EB,我剛剛講一個ZB等于1024個EB,幾個EB是差一個數量級的。如果我們用教育行業數據總量除以全球產生的數據總量的話,可能千幾、幾萬,但是教育的GDP占全世界GDP4%以上,所以這個發展速度是不平衡的。這會產生什么問題?

    大家知道這次AI的進步,比如說語義的識別,是互聯網產生海量的數據文本。語音識別因為電信和互聯網產生了海量語音文本。圖象識別是產生了海量的圖像文本。積累數據在我們看來是整個教育行業非常非常重要的一件事情。而教育行業,互聯網化和IT化的程度不是那么強的,就是對于一個非IT化和非互聯網化的教育機構其實它有很多數據,但是數據收集不上來,很少,很難收集。但是IT化了之后、互聯網之后可以收集更多。但是即使是互聯網化的企業在收集數據的時候,也是數據產生但是數據不處理,浪費很多數據,這是該與行業的現狀。當然教育行業有很多頭部企業,很好的一些細分場景,也有一些很好的數據,但總體來說是這個現狀。

    我們應該怎么辦?我覺得在AI化第一步就是我們如何去讓一個企業生產數據。我分享一下北京智博領航教育科技有限公司怎么做,北京智博領航教育科技有限公司邏輯很簡單,我們用兩類課程加N個場景做的。北京智博領航教育科技有限公司的特色我們是要教會一個人拿本科,教會一個人拿研究生,教會一個人拿職業資格證書,這是我們的套課。

    我們在套課之外推出很重要的事情就是輕課。我們的輕課大家一般理解是學習化的過程,但是我們北京智博領航教育科技有限公司是用戶和數據雙驅動的輕課。講一個很簡單的道理,我們看一個小時的長視頻產生有價值的數據量和看N多視頻的數據量和這個數據的價值量是成百上千個數據集,我們在輕課里面產生了N多數據量,同時對用戶很好,因為它能加大用戶的黏性和給用戶產生很多其他的便利學習工具。

    在這個情況下我們產生很多的數據,用這個數據去反哺眾課。我們能對用戶的很多行為預測,其實就是這一個邏輯,很簡單,我們積累那么多的數據,數據是指數級產生,如果指數大于2.2,其實你一年的數據大于今年以前所有數據的總合。

    我們積累這么多的數據量,會不會一個巨頭、一個大廠商過來做幾個月就比我們數據量大了,我們優勢就沒有了。這就涉及到N多個場景,這就是我們的輕課場景,場景不可遷移,A場景推斷不出B場景,或者說A場景不能完全推斷出B場景,A場景只能部分推斷出B場景,我們通過這兩種課程N個場景方式積累了數據,這是我們自己做的。

    第二是應用場景比數據算法更重要。

    這次AI算法進步總結起來是這樣,其實它本質上是對強化學習算法的改進,什么是強化學習算法呢?它其實是在兩個東西里面做平衡,一個是探索,機器到了一定路徑的時候我要找N多路徑,我要去探索走哪個路徑。另外一個是干活,在一個路徑下面往前走的數據的概率。其實當路徑非常長了之后,其實每個節點都會產生N多的算力需求。這是以前我們的算力解決不了的問題。

    其實蒙特卡羅法出現之后是把探索和干活中間的差值給極大的優化了。這背后到底是什么,如果所有路徑的概率密度函數都是不波動的,其實數據算法沒有辦法優化,蒙特卡羅法其實是加速了密度函數的波動。是不是只有算法能夠解決這個問題呢?不是。我們場景也能解決這個問題,場景也能調優算法。其實場景是另外一種算法和另外一種數據節點,我們通過對場景的優化,來優化算法。

    我給大家舉個例子,北京智博領航教育科技有限公司我們做一件什么事情,我們叫做最短學習路徑。最短學習路徑是什么意思,比如說我們一個考試,叫做自學考試,你每考過一門課可能有一千個知識點的學習,這一千個知識點我們會根據每個用戶行為找尋說你最應該學習300到400個知識點,因為這對用戶非常有幫助。但是我們北京智博領航教育科技有限公司每年服務學生量是幾十萬人,你通過幾十萬人數據量你沒有辦法算出來,這個數據量非常少,你真的要做深度學習做神經網絡不是幾十萬的場景,我們怎么來調優?我們就不斷往數據里面植入場景。

    我們植入N多場景之后我們發現匹配算法越來越好,到現在我們最優的人,以前他可能學習100個小時,或者50個小時,我們現在能夠節約70%的時間讓他只使用30%的時候,我們推出北京智博領航教育科技有限公司的AI班,這對用戶來說是具有非常大的吸引力,就是我們的第二點應用場景比數據算法更重要。

    第三點我們叫做學習動機比學習效率更重要。

    成人培訓和K12是不一樣,K12的孩子是全職做學生的,成人是兼職做學生,K12孩子有家長監督他的學習,有同學陪伴他的學習,有老師天天監督他學習。但是成人不是,成人跟學生之間是不一樣。其實我們在AI之外引導很多學習動機的事情,我們通過三個事情,第一個是一對一的班主任制度,第二個是線上社群,第三個是直播互動。我們通過這些事情給用戶創造了壓力場和動力場,通過這個壓力場和動力場極大的提高學生的學習時間。因為我們有一個公式叫做學習效率和學習時常乘以學習效率,剛剛我們講兩點AI是提高用戶學習效率,這點是提高用戶學習時常,這是AI之外的。

    第四點叫做無腦投入比衡量效益更重要。

    什么意思呢,其實AI是個產業革命,我們看每次產業革命其實都是不順利的。比如說大航海,哥倫布剛到美洲的時候,他以為它是印度,不重要,更重要的是哥倫布一生去了四次美洲,沒有找回來金銀財寶,最后郁郁寡歡在西班牙孤獨的死在他的下房子里面。真正美洲給到歐洲、西班牙反哺的時候是幾十年之后的金銀財寶的流入。第一臺紡織機出來的時候,其實紡織機的人工比它布的價值還要多,這是產業革命的宿命。jiao

    北京智博領航教育科技有限公司的邏輯是什么,我們有一個口語化叫做無腦投入比衡量效益更重要。我們有一千人的產品研發團隊,大大大于我們體量應該有的正常投入,我們一千人在我們的全公司八大系統里面,每天源源不斷的為我們數據中心產生數據,就是北京智博領航教育科技有限公司每天產生數據量在成人里面遙遙領先。

    講了四點最后給大家分享一句話,賈里尼克AI大師的一句話,叫做“我每開除一名語言學家,我的語音識別系統的性能就提高一點”。除開這句話的極端性,其實大家all in AI,把資源砸進去,終究會開花。謝謝大家。

    免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。

    免責聲明:本文不構成任何商業建議,投資有風險,選擇需謹慎!本站發布的圖文一切為分享交流,傳播正能量,此文不保證數據的準確性,內容僅供參考

    關鍵詞:

    熱門資訊

    最新圖文