『壹』 「人工智慧」,「大數據」+教育如何驅動教育的未來
近日,由論答公司主辦的教育大數據研討會在北京舉行,討論會主題為「大數據+教育,有哪些可能性?」。本次研討會主要關注數據在教育領域的應用,具體包括自適應學習、學習數據分析和教育數據挖掘。來自賓夕法尼亞大學、人民大學、華中師范大學的專家和企業界代表,共同探討了教育大數據和自適應學習領域的技術趨勢和產業機會
Ryan Baker是國際教育數據挖掘協會(International Ecational Data Mining Society)的創始人、《教育數據挖掘》雜志(Journal Ecational Data Mining)主編,在各類期刊和會議發表了260餘篇學術論文,先後主持了美國科學基金會(National Science Foundation)、蓋茨基金會(Gates Foundation)等研究基金的多項重大項目,累計獲得研究經費超過1600萬美元。
他也在哥倫比亞大學教育學院和愛丁堡大學同時擔任教職,他在Coursera和edX上開設的「Big Data in Ecation(教育大數據)」課程,有來自100多個國家和地區的學生注冊。
研討會現場,Ryan Baker通過遠程視頻,分享了他對教育大數據的體驗和應用。據他介紹,目前在教育大數據領域主要有四大研究組織,分別研究人工智慧與教育、教育數據挖掘、學習數據分析和大規模學習。
Ryan Baker表示,在教育領域廣泛應用大數據的時代正在到來。教育數據挖掘有很多的應用方向,包括:預測學生是會輟學,還是會成功完成學業;自動檢測學生的學習投入程度、情感、學習策略,以更好地達到個性化;給教師和其他相關人員提供更好的報告;教育科學的基礎研究和發現。
他認為,個性化教育至少要做到三件事情:
1、確定學生的有關數據;
2、了解對於學生的學習來說什麼是真正重要的;
3、有針對性地為學生提供合適的教學。
而通過教育數據挖掘,我們可以推斷很多事情:
學生的元認知和求助。比如,這個學生有多自信?當他需要幫助時,有沒有在尋求幫助?他有沒有在給自己解釋問題,有沒有思考這個答案是正確的還是錯誤的?最重要的,當他面臨挑戰時,能否堅持下去?
沒有投入學習的行為。比如,「玩弄」系統,為了找到正確的答案,有的學生會試各種不同的答案,從「1」試到「38」。粗心,本身會做,但是不用心,最後給出的答案是錯的。有些孩子會做非常難以解釋的行為,比如不用方程符號,而是畫了一個笑臉。
學生情感。Baker的研究團隊和其他研究團隊,已經創造了研究模型,可以根據數據推斷,學生是否感到厭倦、沮喪、困惑、好奇、興奮、快樂,是否投入,等等。
長期的學習結果。比如,學生能夠記住剛才他學的東西嗎?學生准備好學習下一個主題、下一個知識沒有?中學生能上大學嗎?他會從大學畢業還是輟學?
Ryan Baker表示,要獲得這樣的推斷,只需要學生與系統交互的數據,不需要學生戴上頭盔檢測器。目前,這些模型已經開始大規模應用於自適應學習,應用於幾十萬的美國學生。Ryan Baker列舉了一些自適應學習系統的案例。
Knewton
通過系統決定學生下一個要學習的問題是什麼,已在全球的多個領域多個學科中運用。
ALEKS-ALEKS
用的是先行知識結構和知識點模型,來選擇最適合學生的學習材料。比如,一個學生在學習上出現了問題,系統能夠檢測出來,是以前學的知識點出了問題,然後讓學生回到以前的知識點上去學習。ALEKS系統應用於美國高中、大學的數學、科學學科。
Cognitive Tutor
系統能自動檢測學生的知識,直到學生掌握為止。比如,系統不會讓學生學習下一步的知識,直到他展示出他已經學好了他現在正在學習的知識。系統能夠給學校提供數據報告,學校根據報告能夠更好地讓學生投入到學習中去。每年大約被50萬的美國初高中生用於數學學習。
論答
論答公司的系統與ALEKS的系統有些類似,也是用先行結構和知識點模型,選擇合適的學習材料。同時也是自動檢測學生的知識狀態直到學生掌握為止。應用領域目前包括數學和英語,完全針對中國學生開發。
Reasoning Mind
用各種自動檢測的模型來檢測老師的教學是否有效。通過數據生成報告給每個地區的教學管理員,讓他們找到方法幫助老師提高教學。主要是用於美國的小學數學。
Duolingo
自動檢測學生記憶,來決定什麼時候回顧已經學過的知識。在全世界范圍內應用於外語詞彙的學習。
其他的像Civitas,Course Signals,Zogotech都是地區供應商,運用風險預測模型提供行動信息預測。它們會對學生做出預測,可能學不好、會失敗,把報告提供給老師。已在世界范圍內的大學應用。
Ryan Baker指出,在這些系統中,有足夠的證據證明,至少以下兩個系統是非常好的。
1、胡祥恩教授在美國做了大量實證研究,證明ALEKS系統對於幫助學生學習是有效的。他的研究證明,ALEKS系統對於不同人群的學生是同樣有效的;特別值得提出的是,ALEKS可以幫助少數人群群體提高學習成績。
2、Ryan Baker本人領導的研究團隊與論答公司合作的研究表明,學生通過論答系統學習,比通過傳統的在線學習系統學習,效果更好。他們在中國3個不同的地區做的3次實證研究,都證明了論答系統的有效性。
Ryan Baker分析了教育大數據演算法模型的潛在發展方向。他認為,這些模型的長期潛力是,通過學生的知識和學習模型來確認,學生什麼時候需要更多的支持:
首先是「mastery learning」,學生在掌握一個知識前,不會讓他去學習下一個知識。當學生需要支持的時候,自動介入;同時告訴老師和父母,這個學生什麼時候需要支持。
通過學習投入程度模型判斷,學生什麼時候開始變得厭倦、沮喪了,並調整學習活動,讓厭倦的學生不再厭倦,讓沮喪的學生的學習變得更容易一些。
學習投入程度模型還可以檢測,在線學習中,什麼樣的學習活動,能讓學生更容易地投入進去,並最終發現,什麼樣的學習活動對學生更好、對什麼樣的學生更好。
這樣的模型也能告訴老師和父母,學生什麼時候開始變得不再投入學習了。
還可以運用學習模型確認,學生什麼時候沒有真正學會,需要更多支持。
最後,Ryan Baker指出,下一步的目標是優化之前已經驗證的經驗和方法,然後把它們運用到系統中,最終讓中國和世界上的數十億學生受益。
討論:「因材施教」的千年理想該如何照進現實?
王楓博士,論答公司(Learnta Inc.)創始人兼CEO
胡飛芳博士,美國喬治華盛頓大學(George Washington University)統計學終身教授,中國人民大學統計與大數據研究院的教授
胡祥恩博士,美國孟菲斯大學(University of Memphis)心理系、計算機科學系、計算機工程系終身教授,華中師范大學心理學院院長
馬鎮筠博士,論答公司聯合創始人兼首席數據科學家
辛濤博士,北京師范大學中國基礎教育質量監測協同創新中心常務副主任、博士生導師,兼任國家督學、教育部基礎教育課程教材專家工作委員會委員、中國教育學會學術委員會委員。
技術發展到今天,「因材施教」如何實現?
王楓:因材施教,我首先到的是,每位學生學習的內容都不一樣。如果有新的技術或者系統,系統應該像一個好老師一樣,不會頭疼醫頭腳疼醫腳。比如說,一元二次方程做錯了,好老師不會簡單說一元二次方程做錯了,你繼續再做十道一元二次方程的題目,這其實是很差的老師,他沒有真正去全面評判學生,到底是哪些掌握好、哪些掌握不好。
一個好的老師可能會說,我全面地看了你整個學習,可能你的問題不是出在一元二次方程上面,老師看了你做的題目,一元一次方程沒有掌握好、因式分解也沒有掌握好,你繼續做一元二次方程是浪費時間。這就是從系統角度來說,系統做到了根據每個學生最基礎的先行知識點的結構,給你提供最適合你當前學習的知識點,題目也好、視頻也好、還有其他各種各樣的學習內容。
胡飛芳:因材施教是我們教育的理想狀態。孔子很早提出因材施教,在他當時的歷史環境裡面,因材施教可能更多是個體性的,因為那時學生少、老師也少,因材施教相對比較容易做到。
隨著歷史的發展,我們有更多的人需要教育時,我們做的一件事情是什麼呢?就是做了一個標准化。標准化做的是什麼?課堂教育。課堂教育從某種意義上來講是標准化。現在這個歷史階段,教育大數據可能真正要做到的就是因材施教,自適應學習本身想做的也是這個。
胡祥恩:因材施教事實上在學習理論里有兩個:一個是outerloop「學什麼」,一個是innerloop「怎麼學」。用技術來細化因材施教是教育產業走向成熟的一個標志。但是這個路非常非常難,因為「怎麼學」那個層次非常非常難。
馬鎮筠:「因材」代表認識到學生的個體化差異,「施教」指進行差異化教學,這是根本思想。但如果考慮到時代背景,孔夫子時代專注的是學生的職業發展方向,也就是說,把適合當政治家的培養成政治家,把適合當學者的培養成學者。現在再提因材施教,我們其實能做得更多、更精細化。
比如,「因材」,對「材」的分類不僅是職業方向,還會考慮到學生的學習狀態、學習目標、潛在能力、興趣偏好等。而且,傳統意義上的因材施教考慮的是學生個體間的差異,沒有重視學生本身狀態是在發生變化的,學生在不斷學習,狀態甚至興趣各方面都可能發生變化。
但這些是自適應學習能夠做到,甚至比傳統的因材施教做得更好的地方。再說到「施教」,現在我們能做的幾件事,包括學習路徑推薦,給不同的學生匹配他最合適的學習內容,這種非常精細化的層面,我們已經有了一定的技術積累。
怎麼判斷一個產品做到了真正的自適應?
馬鎮筠:大多數產品的學習過程可以分為測、學、練,可以從這三個環節去看這個產品做到什麼程度。
測,各種學習機構都有測評。但是國內只有論答團隊第一個做出來能夠在幾十道題內,精準判斷你一百個知識點,哪21個沒掌握,哪79個掌握了。市場上大部分競品,只會告訴你,知識點掌握率或者分數,79分或者知識掌握率達到79%;或者一些其他維度的總結,比如邏輯思維能力比較強、閱讀的磨煉技巧比較好、學習動力哪方面稀缺。他們做了降維,本來很復雜的學習狀態這樣說出來,相對比較容易實現。但如果要做到具體告訴你,哪些知識點掌握、哪些知識點沒掌握,這個難度就高很多了。
關於學習路徑推薦的話,很多題庫類的軟體,知識點學完之後,會給一些題目推薦,但真正實現路徑推薦的很少很少。路徑推薦也是很核心的,有20個知識點沒掌握,先學哪個知識點,後學哪個知識點,學習順序是非常關鍵的,必須遵循循序漸進的原則,哪些知識點是前提知識點,哪些知識點是後續知識點,隨機給你知識點去學習的話不能起到最好效果。真正到了練或學的環節,推薦什麼樣的視頻,先推視頻還是先推文字講義,推簡單題、中等難度題還是復雜題目,都需要根據學生實際情況來決定。
剛才只是舉了幾個例子,具體涉及到背後的演算法、整個系統跟學習內容的結合以及整個教學流程的實現,中間很多環節必須要打通,形成一個閉環,才能對最終的結果負責。
辛濤:我的研究領域是教育和心理學的測量和評價。我個人的學術觀察,基本上在現代這領域是兩個類型。一個是心理測量領域,有一套成熟的方法,包括早期的IRT(Item Response Theory)和現在的ADT。另外一個是人工智慧檢測。心理測量系統,是一小群人在做;人工智慧化是大的方向,現在是顯學,給大家提供了明顯的可能性。重要的是,那些背後的演算法,能夠在企業里真正實現出來。現在可能很多演算法已經在那兒了,大體上路徑是通的。
自適應學習基本上是把學習和評價聯動起來了。因為,要自適應學習,必須有一個系統隨時看到學生學到什麼程度,這個完全是評價。但是,評價完了之後有一個新的呈現。這一塊現在已經有一些很成熟的一些東西了,但不是一時半時可以說得特別具體的。
我做教育的測量和心理測量,人工智慧那塊我不熟。但是,從教育測量角度來說,在自適應學習和新技術結合之前,很大一塊還是自適應考試,CAT(computer adaptive test)。系列化產生一個CAT變成了一個自適應學習的過程。總的來說,使用最簡單、最機械化的方法,連續的CAT實際上是可以破解一個學習過程的。
測評本身經歷了好幾個階段,通常用三個應用介詞表示。
accessment to learning and teaching;
現在國家倡導的,accessment for learning and teaching,測評要對學習和教學有幫助;
跟信息化結合,accessment as learning and teaching,它是學習提供的完全融合的一個環節。
王楓:什麼樣的自適應學習系統才是真正的高級自適應學習系統?在中國的落地到底是怎麼樣才能真正落地?我在馬博士的基礎上想補充一點。
自適應系統如果一定要分級,也可以簡單分一下。一種最基礎的系統是基於規則的,比如說埋點。一個學生做10道一元二次方程題目,我預先埋好了,你做錯了,立馬給你推五道一元一次方程題目、五道因式分解題目。這個是埋點埋好了,這是規則,預先由老師或公式設置好了。
但這個規則有用性是非常有限的,因為每個學生不一樣,A學生是因為一元一次方程不會,B學生可能是因式分解不會,C學生可能連小學的乘法快速運算都不會,這個沒法預先直接埋點准備好。
所以自適應系統真正到了更高級一點的話,一定是真正通過大數據、根據演算法模型來分析學生的學習數據,匹配下一步應該學什麼。
在中國,自適應學習有效應用於教學有三個前提條件。做到這三點,自適應學習在中國的教育裡面前途無限。
好的產品。必須要有針對中國本土化的自適應學習產品,把它開發出來。像ALEKS系統的確演算法不錯,但裡面連一套國內的高考題都沒有,家長不會讓小孩子用這樣的系統,因為直接影響應試目標。真正本土化開發的話,沒有一成不變的演算法,世界上最好演算法就是沒有開發出來的。教育非常復雜,每個學科不一樣。比如數學後台有強大的關系,先行後續關系;英語沒達到數學這么強的相關性,但演算法是一樣可以應用的。
好的學生、家長、老師。有了好的產品,首先學生應該真正投入進去學習。像Ryan Baker教授講的,學生如果隨便學一下,再好的系統也沒用。第二,家長得督促孩子學習。第三,老師非常重要。老師應該做有價值的事情,比如給學生做個性化的輔導答疑,給學生針對性的講解,組織學習活動小組,鼓勵學生發揮創造能力,領導能力的培養。
學校以點帶面。學生大部分時間都在學校裡面學習。如果學校里最基本的、有效的在線教學產品都不應用的話,其實是有問題的。但是改變絕對不是簡單的行政命令可以解決的。一個好的產品,一定是從點到面,逐步推廣。自適應學習,更適合有明確目的的學習,像應試教育這塊可以做得更好。所以學校可以應用進去。
胡祥恩:我覺得大家做自適應也好、因材施教也好,比較好的例子大家可以看一看。教育這個領域有多大,自適應概念就該有多寬。所以說,實驗室裡面有很多小的做得非常非常好的東西,只是沒有到市場上面去,有很多非常非常巧妙的演算法、一些東西。你會發現很多歐洲的、美國的實驗室做的system,我每次看了都有種,自己是坐井觀天的感覺。
怎麼看待人工智慧在教育中的應用?
胡飛芳:AlphaGo跟master,谷歌做了一個非常好的廣告,人工智慧在某些方面可以做得非常好。但是,我現在給你們講另外一個谷歌自己不會去說的例子,但這也是事實。2008年、2009年的時候,谷歌推出一個免費產品,用各種搜集到的數據,預測美國的流感發展趨勢。開始時很成功,預測跟實際發生的情況很相似。但到2015年,他自動撤回去了,不再提供預測。因為在2012跟2013年預測的時候,預測結果跟實際情況相差非常遠。
這說明像這種不確定性的問題,人工智慧還有非常大的局限性。一旦有不確定的數據,就有噪音。數據量很大時,大數據可能產生大噪音。怎樣使噪音下降?2015年一個哈佛教授的研究團隊在谷歌的基礎上,用谷歌的數據去做同樣的預測。他用了什麼呢?就是用了模型,實際上模型在很多時候降噪是很有用的,用模型去預測,而不完全是人工智慧的方式去預測。結果,他做出來的預測基本都比較准。
人工智慧相對比較成功的,是比較確定的問題,所謂的確定是不管有多少種可能性,還是一個確定的東西。而流感很多時候是完全不確定的因素。
教育其實很多時候也是不確定的。同樣一個人,現在讓他回答這個問題,他可能思路清楚地回答出來;過了一個小時後,即使是同樣類型的問題,按道理他應該回答出來,結果他回答不出來。這是說,實際上有很多因素在干擾的時候,人工智慧的功能是不是會減少一點。把模型跟人工智慧加在一起,會彌補人工智慧在某些方面的弱點,這樣會更好。
怎樣促進商界和學界的交流,更好地把學界已經有的一些成果,運用到市場上來?
胡祥恩:教育產業應該是一個最大的產業,教育產業事實上是一個知識產業鏈。到目前為止,很多人認為自己要做一整套系統而在美國汽車業,最賺錢的是供應商,是做輪胎、做玻璃的。一旦標准化之後,一個人如果螺絲釘生產得最好,他就能夠養活幾家人、幾代人。
到目前為止,美國推的就是教育標准化,教育內容的標准化、教育技術的標准化。比如說97年的時候,就說怎麼樣把內容標准化,你做的東西我可以用。我只是做整個教育知識產業鏈裡面一個小塊,做得很好。教育整個的產業鏈,有可能發揮特別特別技巧的那些小的公司,就能夠在這個產業鏈裡面生存、可以做得很好。第一個是要標准化,第二個要理解整個教育是一個產業鏈。
『貳』 智能英語有哪些品牌啊親希望大家能推薦一些靠譜的
靠不靠譜,不敢說。但是我之前看到過一篇文章,分析了智能英語的發展史希望能幫助到你。以下是文章內容
第一階段:智能英語1.0時代——專注單詞速記。
我們都知道單詞量不多,閱讀看不懂、聽力聽不懂、語法學不會、作文不會寫。單詞量對英語成績影響比重高達62%。由此可以看出,萬丈高樓平地起,打好地基才能蓋高樓。而學考樂做了第一個吃螃蟹的人,專注單詞速記這一超細分市場,發展至今三年多時間,官方數據顯示現在有上萬家校區。截止到目前為止一直未改變其定位,當然競相模仿的產品不在少數,照著葫蘆畫瓢但總覺得蒼白無力,一直在模仿始終難超越,基本無法再復制學考樂智能英語的神話。
第二階段:智能英語2.0時代——以單詞速記為基礎,豐富學科內容
能在第二階段起來的首先要感謝學考樂,因為學考樂其專注的教學定位及極低的價格政策迅速鋪開市場,同時,對整個教育培訓行業是一次智能英語意識的大教育,讓業界開始關注並嘗試智能英語。在這一階段,我們不得不提紅杉樹智能英語。紅杉樹智能英語以其覆蓋單詞、聽力、口語、閱讀、語法、寫作等內容的豐富度、寓教於樂小游戲的趣味度、老師布置任務的互動度,一時間塑造了智能英語2.0時代。而緊隨其後競相跟隨爭流而上的出奇的多。但是卻無法撼動紅杉樹在2.0的江湖地位。哪怕紅杉樹智能英語的價格再高,市場可替代產品再多,還是堅持選擇紅杉樹智能英語,真有種「為伊消得人憔悴,衣帶漸寬終不悔」、「非紅杉樹不嫁」的感覺。說到底是紅杉樹市場馬達效應,是其豐富產品力讓其撐起這時代。
第三階段:智能英語3.0時代——師生互動、生生互動
這世界!創新可能會成為炮灰,但一旦創新成功必定不被世界辜負!智橡樹智能英語能夠在亂象叢生的智能英語市場競爭格局中脫穎而出,離不開創新二字。智能,什麼是智能?智能的本質就是互動。如果說智能英語的1.0時代和2.0時代是人機互動,那麼智能英語3.0時代是什麼?必定是師生互動、生生互動。智橡樹在認真分析了當前智能英語市場競爭的格局後發現,現在的智能英語產品基本都是學生通過電腦學習系統已經設置好的知識內容,只是每個學生的學習進度不一樣而已。短期內看有一定的教學效果,但是長期下去還是枯燥機械。是否可以讓老師參與進來,不再僅僅是學生對著電腦刷題?能夠讓學生之間互動起來,讓學生能夠有情感的互動?於是智橡樹在2.0的基礎上增加了「一個中心兩個基本點」,所謂一個中心,即是同步教材章節及知識點的題庫,智橡樹教研團隊嘔心瀝血歷時整整一年經過大量的數據收集匯總工作,精心打造了同步教材題庫。這一題庫最大的亮點就是為全國300多個版本教材的每個章節都定製一個題庫:首先題目新穎,全部來自近三年的試卷真題。其次題型豐富,聽力題、選擇題、判斷題、填空題、完形填空、閱讀理解、任務型閱讀、寫作應有盡有,甚至連一個聽力題都分為聽力填空、聽力選擇、帶圖聽力、多類型聽力組合題。最重要的是,每個章節都盡可能涵蓋了多題型多題量,完美地實現了同步教材章節及知識點制定單元、期中、期末等測試卷。所為兩個基本點,一個是同步教材章節為學生定製個人試卷,哪裡不會練哪裡,實現個性化教學;另一個是同步教材章節出題組卷發布對抗賽、排位賽等賽事活動,拉動多名學生互動參賽在比拼中提高學習興趣和成績。這一創新的智能交互教學模式以及背後的技術水準,非一般水平可及,所以智橡樹一時間在智能英語領域與其他產品之間拉開了一個大截,孤獨而又寂寞的創出了智能英語3.0的時代。
其實,智橡樹早已打破常規,不再僅僅滿足這一步。目前智橡樹已經正式提出了OMO混合教學理念,積極籌劃匹配線上教學的線下教輔書,真正讓智能英語這一線上更加完美的融合到線下教學,實現線上線下分工明確而又融合緊密的OMO混合教學模式。並於2020年5月與安徽省濉溪縣祁集中心學校、建元中學等多所公立民辦中學達成《人工智慧教育下的中考課題班教學成果探究》課題的合作,並於2020年8月正式發布了課題結題報告。課題班學生通過智橡樹0MO混合教學法實現了明顯提分。這一教學法實踐成果不僅是智橡樹從一家互聯網教育科技平台到教研+內容平台的華麗轉身,而且是對智能英語提分效果充分的肯定和對所有智能教育從業者和參與者的極大信心,更是智能教育融合線下教學的重大突破!
未來,智能英語將往哪裡發展?我們拭目以待!