早在四維度公司的時候,九重就已經(jīng)習(xí)慣了一種金字塔協(xié)作開發(fā)模式,金字塔主要形容的是整個團(tuán)隊中各人的能力值,位于金字塔最頂端的自然是能力值最高的一人,越往下能力值越低,最底層的那些程序員很有可能是剛畢業(yè)的學(xué)生。
這就是四維度獨(dú)特的帶頭人制度,每個團(tuán)隊基本都是這種金字塔結(jié)構(gòu),最頂端的帶頭人,必須是能夠總攬大局之人,帶頭人會關(guān)注與程序的構(gòu)架,同時負(fù)責(zé)解決下方提交上來的難點(diǎn)問題,下來一級是程序模塊的負(fù)責(zé)人,他會帶領(lǐng)更下層的程序員完成指定模塊的。
這種特殊的協(xié)作模式,不是主動設(shè)計出來的,而是被逼出來的,四維度有相當(dāng)長一段時間處于缺人的狀態(tài),為了解決缺人的問題,四維度被迫規(guī)定老人必須帶新人的協(xié)作模式,讓新人們再項目開發(fā)的同時獲得成長,后來慢慢演化成了完善而優(yōu)良的帶頭人制度。
金字塔模式有兩大優(yōu)點(diǎn),一是完美發(fā)揮出不同層級程序員的能力,讓整個團(tuán)隊的性價比變得極高。高級的你就應(yīng)該去關(guān)注全局,碼代碼的工作盡量交給下層的人吧。中級的你還擔(dān)當(dāng)不了大任就應(yīng)該跟著大佬學(xué)習(xí),同時帶帶新人教他們技術(shù)的同時鞏固你的基礎(chǔ),新人的你就應(yīng)該多寫、多想、多問。
若一個隊伍中全部是大佬,整個團(tuán)隊的運(yùn)作反而會出現(xiàn)問題,這些大佬會想,憑什么你來領(lǐng)頭?明明我上我也行啊!憑什么你的工作量那么少我這邊那么多?憑什么你接的是簡單任務(wù)我要接艱巨的任務(wù)?不患寡而患不均的思維反而讓整個團(tuán)隊的效率低下,若是金字塔結(jié)構(gòu)這種問題就很少了。
第二大優(yōu)點(diǎn)是,每個層級都向下傳遞知識和經(jīng)驗,使得個各層級的技術(shù)不斷獲得提高,為整個組織源源不斷的培養(yǎng)新鮮的血液。
對于帶頭人,其實(shí)還有一個優(yōu)點(diǎn),那就是整個項目中,帶頭人需要編寫的代碼量是最少的,帶頭人做的最多工作反而是解決下面提交上來的問題。
九重在啟動了vr項目和翻譯項目之后,理所當(dāng)然的決定繼續(xù)使用金字塔模型的協(xié)作模式。九重也就成為了帶頭人的帶頭人,但凡帶頭人解決不了的問題,提交到九重這邊絕對會快速的響應(yīng)給你最佳應(yīng)對方案。嗯!只是應(yīng)對方案而已,九重很少直接碼好代碼給韓藝他們的。
因為這樣的制度,九重其實(shí)投入在項目上的時間其實(shí)并不是太多,這才有時間做其他工作。
----
與韓藝商談vr項目上的一些細(xì)節(jié)之后,九重請韓藝幫忙定制一個人物模型。
“阿克圖爾斯蒙斯克”
“那是誰?”韓藝顯然沒有聽說過這個名字。
“你隨便上網(wǎng)查一下就知道了,模型精度達(dá)到你當(dāng)前這個模型的等級就差不多了,材質(zhì)的細(xì)節(jié)要求更高一些?!?br/>
“好吧!到時候我會安排的。時間上有要求嗎?”
“時間倒是沒什么要求,做好了發(fā)給我就可以了”
確定沒什么事情之后,韓藝下線了。
不一會兒,翻譯項目組的夏羽也被召喚到了虛擬辦公場景中。當(dāng)前夏羽使用的還是電子眼的虛擬形象,沒有像韓藝那樣去設(shè)計和替換自己的虛擬形象。
夏羽是個比較活躍的人,被召喚過來后不等九重問話,他就先開口了:“老大叫我過來什么事情”
“就是想了解一下翻譯項目的進(jìn)度?!?br/>
---
單從技術(shù)水平的角度來說,夏羽的編程技術(shù)是不足以擔(dān)當(dāng)項目帶頭人角色的,不過因為項目的特殊性,夏羽掌握的語言學(xué)識和程序員的身份,偏偏又與項目的契合度極高,所以九重還是讓他帶隊翻譯項目了。
并且翻譯項目這邊需要做的工作也比較另類,夏羽掌控全局是完全沒有問題的。
翻譯項目前期需要做的工作主要是數(shù)據(jù)的收集。
收集什么數(shù)據(jù)呢?自然是詞庫、翻譯對照表這樣的數(shù)據(jù)。
翻譯的程序本質(zhì)是什么?
簡單!
翻譯程序就是先獲得用戶的,然后由程序去數(shù)據(jù)庫,找到了對應(yīng)的翻譯對照內(nèi)容,便可用戶的提問了。
最重要的東西只有兩個,一個是數(shù)據(jù)庫,就是包含了很多個語種的翻譯對照表。如果能搞來這個數(shù)據(jù)庫,就算是最初級的程序員也能搗鼓出所謂的翻譯軟件。
二個是搜索算法,低級的算法當(dāng)然是簡單的查找并提取結(jié)果就行。但高級的搜索算法可就不這么簡單了,單單是提高翻譯精確度這一條就不知道要花費(fèi)多少腦細(xì)胞才能設(shè)計出合理的算法。
所以九重對翻譯項目的這樣安排的,項目從頭到尾要一直完善自己的,包含各語種的詞庫,各語種翻譯對照表等數(shù)據(jù)。越全面越好!等收集得差不多了再設(shè)計一套翻譯算法管理語料庫即可。
九重的翻譯項目組之前做的就是數(shù)據(jù)收集的工作,不是人工錄入那種笨蛋式的數(shù)據(jù)建立方式,而是通過編寫一些特殊的小程序,由程序來提取網(wǎng)絡(luò)中的語料庫。
百度谷歌翻譯自然而然的成為了重點(diǎn)照顧的目標(biāo),有現(xiàn)成的干嘛不用?自建多辛苦?。?br/>
另外像是某某詞霸,電子辭典之類的軟件都成為翻譯小組偷竊的目標(biāo)。在九重從旁輔助的情況下,翻譯項目小組的程序員們都快變成一個盜竊團(tuán)伙了,到處打劫別人家的語料庫。反編譯、破解、注入等技術(shù)用得越來越666了。
---
“目前已經(jīng)建立的,語料庫相對完整的六個語種分別是漢語、英語、日語、印度語、阿拉伯語、西班牙語,以這六個語種為初始數(shù)據(jù),借用各種手段,已經(jīng)建立起了這六個語種與其他144個語種的互譯數(shù)據(jù)庫。也就是說,我們已經(jīng)可以實(shí)現(xiàn)一百五十個語種之間的翻譯了?!毕挠鸹卮鸬?!
“這么快?”九重有點(diǎn)吃驚!這速度比想象中的要快很多?。?br/>
這才一個多月而已,已經(jīng)做到這種程度了?
看到老大吃驚!夏羽頗為得意,不過卻謙虛的表示:“這還多虧了老大編寫的那個妖孽小程序的功勞!只比起我們自己寫的那個程序,差距上了千倍都不止啊。”
翻譯小組曾自己編寫過一個自動翻譯程序,該程序借用谷歌翻譯返回翻譯結(jié)果,效率大約是15秒可以獲得一個單詞的翻譯數(shù)據(jù),按這個速度,英文語料庫75萬個單詞,一臺電腦要13天才能獲得英文和漢語互譯對照數(shù)據(jù)。這個工作量就算平攤到翻譯小組13臺機(jī)器上,也需要1天時間才能獲得2個語種的互譯數(shù)據(jù)。
最坑爹的是他們制作的程序還不能關(guān)閉網(wǎng)頁,基本上運(yùn)行這個程序,電腦也不能干啥事情了。
150個語種的兩兩互譯知道要執(zhí)行多少個循環(huán)嗎?
(嗯~在下也算不清楚)
反正很多就對了,九重看到他們做的程序之后,當(dāng)然嗤之以鼻,然后只用半小時制作出了一個可以多開、可以以借用公司一百臺計算機(jī)、在后臺運(yùn)行的翻譯輔助工具,100臺機(jī)子,每臺程序*3,每秒共計可返回1200個翻譯數(shù)據(jù)。
這效率驚呆了把翻譯小組的小伙伴們都驚了個呆!
“也就是說,基礎(chǔ)的單詞翻譯數(shù)據(jù)已經(jīng)建立起來了?”
夏羽說道:“準(zhǔn)確說,真正完善的只有之前我提到的6個語種的翻譯數(shù)據(jù),其他的語種或多或少還有些數(shù)據(jù)缺失,現(xiàn)在正整在檢查和補(bǔ)全中,現(xiàn)在每天大約能檢查3-5個語種的部分遺漏?!?br/>
“數(shù)據(jù)庫仍然是在原來的那個磁盤中吧!”
“是的,這個道沒變!”
“那我先去看看情況,順便做個備份什么的,你先在這里等我一下,等下和你說個正事?!?br/>
十分鐘后!
九重回來了,和夏羽說道:“數(shù)據(jù)庫的資料我已經(jīng)看過了!基本上已經(jīng)達(dá)到了我的要求的,那么!接下來,我們就要在算法上面下功夫了!我來和你說說翻譯項目的下一個流程吧!”
(未完待續(xù)~)