【均一】我是資料人,為什麼我想要加入均一?

可以快速介紹一下均一嗎?

均一的願景、使命

願景:讓每一個孩子都有機會成為終身學習者。

使命:

  • 提供所有孩子可規模化的個人化學習,並培養他的自學習慣。

均一教育平台最初是由財團法人誠致教育基金會創辦。我們的目標是透過雲端平台提供免費的『均等、一流』的教育機會給每一個人。

任何人都可以使用網站所有的資源。不管你是學生、老師、自學家庭、校長、二十年後想回去當學生的大人、或是對地球生物好奇的友善外星人,均一的課程內容與資源完全免費提供使用。

均一的故事可以參考這裏,我簡述其中一小段:

2017年,方大哥期望均一的理念:「關懷弱勢,科學救國」能夠傳承給下一代、交棒給年輕人,在與時任財團法人誠致教育基金會的執行長呂冠緯及誠致董事會多次開會討論過後,決定由呂冠緯與均一團隊一起成立一個新的基金會 — — 財團法人均一平台教育基金會。

誠致教育基金會經營均一教育平台五年來,平台註冊人數超過 95 萬人,舉辦超過百場大大小小的教師研習。2018 年起,誠致教育基金會無償授權均一教育平台的智慧財產權給「均一平台教育基金會」。

「均一平台教育基金會」承接均一教育平台的業務,擔起重責大任、傳承長遠使命,並以「讓每一個孩子都有機會成為終身學習者」為願景,持續為台灣的教育注入改變的力量。

均一的現況

目前均一組織架構為:

  • CEO:就是 CEO 啊!
  • 軟體:任何跟 coding 相關的,就是我們的守備範圍
  • 推廣:任何跟教育現場相關的推廣活動,就是我們的守備範圍
  • 教育:任何影片、習題、教材研發,就是我們的守備範圍
  • 營運:除了以上,都是營運的守備範圍(驚人! 堪稱是均一的若林源三,就不要多問他是誰了 XD)

總共 31 位正職,平台數據可以在這裏檢視,簡單來說,我們目前平台註冊人數為 150 萬人,週活躍為 6 萬人,並有十個深度合作縣市,內容面則有 1 萬支影片、4 萬個習題供使用,這些數字還在持續增加中,當然,這些指標只是我們進行決策,走對方向的具體參考,不代表 end goal,最終我們還是希望能對上我們的願景使命,並能做到「科學救國、關懷弱勢」的初衷。

加入均一有什麼優缺?

我認為的優點

  1. 人 — open mind:我們的夥伴來自各行各業,各自有不同的專業領域及經驗,甚至跨域,有電機跨教育、有管理跨推廣、有硬體跨軟體、大公司跨小新創等等,因此我們在看問題時,常常有不同的觀點以及解法,這幫助大家再看一個新問題時,提供了不同的角度或是跳脫框架,避免用無效的或是老方法做事,特別我們是一個新領域,常常找不到前人的解法,需要去借鏡其他行業的方法加以改良。喔對了,我們 CEO 就是好好的醫生不當,雙腳跨過來的(恩…有時候我是會找他問問診,參考參考啦 XD)
  2. 事 — data-driven 的決策方式:人有經驗、直覺、第六感、因此生活很多決策常常都是靠感覺,例如:午餐吃什麼?這顆三分球要不要投?明天約會要不要去?但是論及公司經營、投資、工作上的決策,任何一個決定可能就是上萬、億的決定,甚至是影響長遠,因此我們盡可能檢視任何一個決策,不管採用量化或是質化數據,重點在於可以事前評估,事中管理,事後監測,而不是單憑管理層或是 CEO 的一兩句話就決定。了,如果你喜歡這樣的「就事論事」的做事方式,勇於發言、辯證,那這裡很適合你
  3. 時 — 工時彈性:我們有明定的上班時間,十點到六點半,但取決於你的需求,你可以彈性調整,我們尊重你的個人時間管理,晚上有任何的進修,如果有帶回來 present 給同伴,也能算是上班,隔天可以晚點到,我們更不提倡加班,如果一定要在非上班日工作,補休是合情合理的,希望能營造 work smart 的文化,不要用戰術上的勤勞,掩飾戰略上的懶惰。
  4. 地 — 近捷運善導寺站:這就不多說了,見仁見智,但我認為這個地點,可能比眾多的科技園區來得友善多了,搭配我們十點上班時間,交通也方便,同時,我們也鼓勵員工可以 remote 工作,不要求一定要每天進辦公室,如果在咖啡廳可以有效率產出,那我們也尊重你的決定,我們要的不是你的打卡工時,而是你的有效產出及影響力。
  5. 物 — 書:我們有很多書,不是全部都是歐萊禮那種技術書(當然,我們也有),因為 教育 x 科技 是個較新的領域,我們不敢說是專業,但我們朝向那個方向走,因此除了教育、技術外,我們買了很多心理、市場、創業、管理的書籍,只要夥伴有需求,都可以申請買新書(我是還沒看過有人這麼新潮買漫畫啦,如果你覺得合理,我是覺得應該不會擋…)

目前的缺點,但可能也是個挑戰

  1. 我們很要求理性與感性並重,如果你偏重一邊,可能需要適應,但是這會是一個很好的訓練,在一個非舒適圈的工作,成長會是難以想像的,像是筆者本來腦袋應該是偏感性的(不然也不會這麼浪漫,跑來這裡),誰知道這裡做事卻是這麼邏輯化,也歪打誤撞,練成了一手資料分析的功夫。
  2. 我們面對很多沒有業界標準做法的挑戰,那種感覺大概就是車子發明前,你看著一群馬在路上跑,但你不能想怎麼優化「養馬」的技術,必須想出更好的方法優化交通,有時候我們會說這一行可能沒有真正的專業,做出來你就是專業了,期待你成為下一個福特。
  3. 薪水可能無法跟大公司相比,但也不致於低於新創水準,這取決於你目前的家庭狀況、經濟需求,我不會說:「追求未來的淺力、社會的福祉,就算你每個月月光也值得」,這樣的幹話,我自己都無法接受了,我們希望你能健康第一、家庭第二、最後才是樂在工作,因此如果薪水的部分,你真的無法接受,請不要委屈自己,希望我們可以一起共好。
  4. 容易變胖,我們常常有午餐聚會、辦公室有零食、週五也有 happy hour,希望你能對洋芋片手下留情,不然就一起來約下班運動吧!

資料人的均一日常?

觀察

在均一資料不是一個 team,他是空氣般的存在,喔不是不重要的意思啦!是說資料人雖然編制在軟體組(畢竟我們要寫 code 啊),但其實題目到處都是,不只是軟體功能上的 AB test,還有他組的管理、流程優化,例如:教育影片生產後的管理機制有沒有辦法用資料監控? 老師參與研習後,是否遇到困難了? 能不能用資料知道學生都怎麼學的? 或是設計後的成效,有沒有辦法用資料驗證? 這些都不會是資料夥伴們自己燜著頭,就能解出來的題目,燜著頭想出來的題目跟解法,往往都不會是當事人的當務之急,所以常常會看到業界或社群有一些文章嘆息,資料人作出來的成果容易石沈大海的窘況,這取決於你解的問題,重不重要、緊不緊急

所以,資料人在均一,除了會有人直接來發資料需求外,有時候也需要到處去 social,挖一些好題目回來,當然,這不一定是每個人都喜歡做的事,但我認為一個好的資料科學家,跨領域學習是有其必要的,如上圖(甚至如下圖也不誇張),學習前,試著去了解你的當事人吧,畢竟做資料不像在接一般的案子:說一做一,有時候是需要花時間跟該領域「搏感情」的

溝通

先忍住不寫code,有時候一個題目並不像表面敘述般的簡單,往往藏著冰山下的問題,身為一個用資料解決問題的人,我們要學會判斷這個問題適不適合用資料解決,這才是專業的第一步,相信「問對問題,就解決了一半」,但往往該領域的問題並不熟悉,因此需要好好跟委託人深聊,同時快速學習該領域的重點,這一點快速吸收、快速學習的功夫,跟顧問業其實很像,因此比較廣泛的來說,我們常常會問以下幾個問題:

  • 為什麼會出現這個問題?或是,問題是怎麼發現的?
  • 這個問題帶來了什麼麻煩?
  • 解決的問題可以帶來多大的好處?
  • 如果我給你某某解法,你會怎麼 take action?

當然,仔細問下去,可能會出現更多問題,這裡就不贅述,要提醒的是,這一行是除了考驗 coding skill 外,也考驗你的 people skill,釐清問題要保持耐心是必要,偏偏資料科學家大部分都是急性子,真是矛盾啊,克服這個矛盾將讓你更成長一步,如果問題都切割乾淨,只要一步一步花時間做就好,那… 為什麼不交給機器呀?

Photo by Derek Oyen on Unsplash

實作

終於可以開始實作了,這裡就不多說題目正確下,用不同方法論做出結果的程序,這些都能 google 到,想要提的是實作時常常會發生的插曲,其實有時候會發現委託人說的問題,往往只是冰山一角,或是這個問題的根本不是當初釐清的那樣,例如:委託人說:「習題的提示有分階段,點一下給一個,有沒有一個最佳的階段數字,擔心學生沒耐心,最後會一次把提示按完,看完答案就填答,可以想辦法用資料找出最佳解嗎? 」,看完這一題,你可能會有很多解法,包含跑回歸,搞個 ML model,視覺化等等

實際上,探勘加上訪談才發現,原來學生發現不管提示按到哪一個階段,只要有按,這一題就是沒有獎勵分數了,那我按一半跟按到底不是一樣嗎?反正都沒分了,不如趕快按完進到下一題,這是很實際的人性,應該從獎勵機制下手才對

你說,這樣我就沒題目做了啊?相信我,資料硬要跑的話,一定都能跑出結果,但是不能落地,產生影響,就沒有價值了,我們是來解決問題的,不是嗎?

展示

Demo 吧,把你的 insight 告訴大家,讓大家知道原來從資料里,可以發現這些,並尋求多角度的回饋,讓落地盡可能的平穩。在均一我們不要求 demo 一定要多 fancy,或是像 TED 那麼的專業,但是希望資料的洞見能夠說得平易近人,讓非專業的聽眾能夠有所得,並促進交流,因此如何包裝你的洞見在這個環節非常重要,這裡的包裝,可不是欺騙、造假,而是讓大家可以見樹也見林

聽起來很難對嘛?這也就是為什麼開頭說在日常我們要跟不同領域的夥伴多做交流的原因,如果我們不知道聽眾的胃口、程度、心理需求是什麼?那可能很難說出一個好故事,造成影響

聽起來不錯,我需要什麼技能才能加入?

工商時間到了,我用說故事的方式來帶入這個情境:

基礎建設

我們的平台建立在 Google Cloud Plateform,因此資料順勢放在Google BigQuery,每週會進行資料備份,並轉換資料進入 data warehouse,這裡會碰到就是 data engineering 的部分,如下圖:備份、ETL 轉換、存取 GA、後端 streaming log 存取等等

分析

  • 分析前,會用 SQL 在 BigQuery 上進行 Explore ,確定資料存在或是可用,另外,部分 case 也會同時 sampling 一些資料,製作 prototype 跟委託人核對,確定合用就會進行規模化的後續作業
  • 分析中,我們會使用 docker 建立 jupyter notbook 的 python3 環境,同時搭配 dplyR 套件,讓 python、R、SQL 都能用於分析,不讓工具及環境設定限制住我們的產出,甚至是人才的發展,當然,如果你想在一份 code 裡面,同時寫上三種語言,當一個資料界的三刀流索隆,我也是不反對啦,只是 code review 時會比較辛苦
  • 分析後,產出進入產品化落地,大部分會有這幾種做法:
  1. 視覺化:通常用於不定期的檢視用,或是公開讓大家有感
  2. 報表:通常用於定期檢視,在各個大大小小的會議中,提供參考,以利決策
  3. 定義公司專有名詞:隨著組織成長,業務需求會有所更迭,過去的定義可能需要更改、或是創造出新的定義,例如:「穩定」使用用戶,這裡的「穩定」,就需要明確定義,這時候就需要資料科學家,協助一起提出一個合理的定義

簡單一點?那我們還是來條列一下技能需求:

Must

  • R、Python、SQL 熟悉其中一種
  • 有過資料分析的經驗
  • 樂於溝通、討論

Nice to have

  • 有過線上平台分析經驗
  • 有 ML、AI 專案經驗
  • GA 操作經驗
  • 個人私心 — 如果你看我的文章,願意給我回饋的話

徵才連結: https://official.junyiacademy.org/job