您的位置: 首頁>>關(guān)于我們>>行業(yè)動態(tài) |
最近 IT 行業(yè) 有三個 事件 特別 值得 觀察 ,首先 是《北京市 外來 新生代 農(nóng)民工 監(jiān)測 報(bào)告 》,在這個報(bào)告 中官方 首次 將從事 軟件 和信息技術(shù) 服務(wù)行業(yè) 的人員 列入 農(nóng)民工 范疇 ,這種 說法 雖然 得到 廣大 程序員 們的廣泛 認(rèn)同 ,不過 為什么 軟件開發(fā) 與傳統(tǒng) 的農(nóng)業(yè)生產(chǎn) 越來越 像,也值得 深思 。
其二 ,OpenAI發(fā)布 了自動編碼 系統(tǒng) ,這是 一款 可以 將英文 需求 描述 直接 轉(zhuǎn)換 為代碼 的神奇 工具 。
雖然 Codex首發(fā) 版本 的表現(xiàn) 還不能 完全 盡如人意 ,但AI 編碼 技術(shù) 的發(fā)展 卻給開發(fā)者 們敲響 了警鐘 ,未來 只要 有創(chuàng)意和算力 ,也許 真的 就就萬事俱備 了,程序員 也許 并不是 一個 必選項(xiàng) 。
其三 ,國際 IT 咨詢機(jī)構(gòu) Forrest發(fā)布 了《云原生開發(fā)者 洞察 白皮書 》,對于 云原生時(shí)代 對于 開發(fā)者 的機(jī)遇 、挑戰(zhàn) 、升級 路徑 等等 問題 進(jìn)行 了探討 ,對于 《開發(fā)者 白皮書 》中的觀點(diǎn) 筆者 深表 贊同 ,云原生到底 會如何 影響 未來 的開發(fā)模式 ,對于 這個問題,每一個開發(fā)者 應(yīng)該 都會 有自己 的思考 。
筆者 認(rèn)為 云原生時(shí)代 ,開發(fā)者 要學(xué)著利用 Codex這樣 的新工具 ,在云原生的大農(nóng)場 上進(jìn)行 編程 ,而云原生則提供 了一個 真正 能屏蔽 底層 的開發(fā)平臺 。
云原生時(shí)代 的開發(fā) 最重要的是「人」「云」合一 ,而「人」「云」合一 的關(guān)鍵 則在于 全棧 ,只有 真正 做到 全棧 融合 才能 將各技術(shù)領(lǐng)域內(nèi)坑洼 不平 的丘陵 ,變成 真正 肥力 十足 的平原 ,挖掘出 工具 的潛力 ,發(fā)揮 云原生的價(jià)值 。
云原生想建 黃金農(nóng)場 不容易
無論是 K8s、容器 還是 最近 火爆 全網(wǎng) 的Serverless、Dubbo,云原生相較 于傳統(tǒng) 技術(shù) 其最大 的優(yōu)勢 在于 能夠 充分利用 云原生平臺 的組件 及工具 鏈,屏蔽 底層 技術(shù) ,使開發(fā)者 耕耘 的土地 更像是 一片 廣袤 的農(nóng)場 ,幫助 開發(fā)者 節(jié)省時(shí)間 ,但是 想屏蔽 底層 光憑嘴說遠(yuǎn)遠(yuǎn)不夠 ,尤其是在大數(shù)據(jù) 及AI 領(lǐng)域 更是如此。
根據(jù) IDC 定義 ,大數(shù)據(jù) 是指 現(xiàn)有 技術(shù) 難以 處理 的數(shù)據(jù) 。
從歷史 來看 ,在谷歌 提出 大數(shù)據(jù) 三駕馬車 的論文 時(shí),當(dāng)時(shí) 的關(guān)系 型數(shù)據(jù)庫技術(shù) 的確 難以 處理 大規(guī)模 的數(shù)據(jù) 。
傳統(tǒng) SQL 在谷歌 海量 的查詢 記錄 面前 ,根本 跑不出 結(jié)果 。
也正是 由于 數(shù)據(jù) 越來越大,人們 對于 數(shù)據(jù)庫 的看法 開始 轉(zhuǎn)變 ,從一開始 單純 認(rèn)為 數(shù)據(jù)庫 是加工 車間 ,轉(zhuǎn)變 為數(shù)據(jù)庫 也需要 是儲存 倉庫 ,而數(shù)據(jù) 已經(jīng) 是加工 完成 的成品 ,沒有 被重塑 修改 回滾 的需求 。
而隨著 大數(shù)據(jù)應(yīng)用 的進(jìn)一步 拓展 ,業(yè)界 發(fā)現(xiàn) 價(jià)值 密度 更低的非結(jié)構(gòu)化數(shù)據(jù) 也有 儲存 及挖掘 的必要 。
比如 客服 的對話 可能是語音 、文字 甚至 是圖像 、視頻 ,這都不是 傳統(tǒng)意義 上數(shù)據(jù)庫 、數(shù)倉可以 處理 的結(jié)構(gòu)化數(shù)據(jù) ,因此 用于 儲存 非結(jié)構(gòu)化 的數(shù)據(jù)湖出現(xiàn) 了。
在了解 數(shù)據(jù)存儲 模型 的演進(jìn) 過程 后,我們可以看出 關(guān)系 型數(shù)據(jù)庫 、數(shù)據(jù)倉庫 與數(shù)據(jù)湖的底層 構(gòu)建 模型 并不相同,大數(shù)據(jù) 領(lǐng)域 各個 技術(shù)棧幾乎 全部 是由開源社區(qū) 推動 的,數(shù)據(jù) 技術(shù) 的快速 發(fā)展 卻也帶來 了領(lǐng)域 內(nèi)部 的無盡 割裂 。
數(shù)據(jù) 是AI 乃至 整個 IT 行業(yè) 的血液 ,是業(yè)務(wù) 開發(fā) 鏈條 上的重要一環(huán),但各環(huán)節(jié) 的兼容性 不佳也引發(fā) 了很多 衍生 問題 。
這其中 最嚴(yán)重 的是數(shù)據(jù)處理 的時(shí)效性 問題 ,大數(shù)據(jù)工程師 往往 需要 在T+1日以后 才能 給出 報(bào)表 ,但是 產(chǎn)品經(jīng)理 卻永遠(yuǎn) 需要 實(shí)時(shí) 的用戶畫像 ,對于 時(shí)效性 的要求 成為 了技術(shù) 與業(yè)務(wù) 之間 永遠(yuǎn) 無法 達(dá)成 的協(xié)議 。
當(dāng)前 ,科技企業(yè)要處理 的數(shù)據(jù)量 還在 迅速 增長 ,從筆者 了解 到的情況 ,各大廠 的數(shù)據(jù) 量級 正在 以年化 80 %左右 的速度 增長 ,如果 按照 現(xiàn)在 的迭代 速度 ,大數(shù)據(jù)技術(shù) 棧繼續(xù) 分化 ,那么 云廠商 如果 拿不出 全棧 大數(shù)據(jù) 解決方案 ,開發(fā)者 的云原生開發(fā) 也就根本 無從談起 。
因此 只有 提供 包括 數(shù)據(jù)采集 、數(shù)據(jù) 規(guī)范 、數(shù)據(jù)開發(fā)、數(shù)據(jù)服務(wù) 、數(shù)據(jù)治理 、數(shù)據(jù)可視化 在內(nèi) 的全棧 式大數(shù)據(jù)工具,將數(shù)據(jù)集成開發(fā)平臺 與應(yīng)用 云平臺 與容器 大數(shù)據(jù)平臺 打包 交付 ,才是 有競爭力 的云原生產(chǎn)品 。
AI 落地 ,必走全棧 之路
如果說 大數(shù)據(jù) 需要 全棧 解決方案 是個錦上添花 的選項(xiàng) ,那么 AI 對全棧 的需求 則是必選項(xiàng) 。
從目前 AI 的發(fā)展趨勢 來看 ,最新 的人工智能 模型 對于 算力 的要求 往往 都是 非常 高的,比如 谷歌 的T5 ,其整個 模型 的參數(shù) 數(shù)量 達(dá)到 了驚人 的110 億,甚至 谷歌 科學(xué)家 直接 在T5 的論文 指出 :“越大的模型 往往 表現(xiàn) 更好 。
這表現(xiàn) 擴(kuò)大 規(guī)模 可能 仍然 是實(shí)現(xiàn) 更好 性能 的方式 。“
不過 一般 的創(chuàng)業(yè)公司 如果沒有 雄厚 的資金 實(shí)力 是不可能 搭建 這種 級別 的AI 訓(xùn)練 平臺 。
像去年 火爆 一時(shí) 的GPT -3的出現(xiàn) 充分證明 了大力 就是 能夠 出奇跡 ,這個 訓(xùn)練集45 TB ,參數(shù) 規(guī)模 1750 億,預(yù)訓(xùn)練 結(jié)果 700 G的AI 模型 一經(jīng) 問世 就成為 了大眾 矚目 的焦點(diǎn) 。
一時(shí)之間 用GPT -3作詩 、作曲 乃至 畫畫 的應(yīng)用 層出不窮 ,不過 GPT -3的訓(xùn)練 成本高 達(dá)上千萬美元 ,這也進(jìn)一步 提升 了AI 領(lǐng)域 的入門 門檻 ,只有 巨頭 才能 玩得起AI 。
不過 另一個 角度 講這樣 的趨勢 也推進(jìn) 了AI 全棧 技術(shù) 與云的結(jié)合 ,只有 將云、人與 智能終端 結(jié)合 到一起 ,才能 降低 門檻 ,促進(jìn) AI 行業(yè) 創(chuàng)新發(fā)展 。
而這種 結(jié)合實(shí)際 與全場景 全棧 AI 是同一 概念 ,只有 算力 不行 ,只有 框架 不行 ,只擅長 訓(xùn)練 集群 也不行 ,只有 把這些 方面 結(jié)合 到一起 ,做到 沒有 短板 才能 做好 AI 云,才能 讓AI 充分發(fā)揮 威力 ,體現(xiàn) 價(jià)值 。
云原生呼喚 程序員 的創(chuàng)造性
從OpenAI官方 的說法 來看 ,Codex試圖 理解 需求 描述 中的邏輯 ,并盡可能 生成 最好 的代碼 。
與其 同門 師兄 Copilot一樣 ,Codex也是基于 GPT -3構(gòu)建 的。
不過 目前 GPT -3的工作原理 也就決定 了Codex、Copilot等輔助工具 本質(zhì) 上還是 播種機(jī) 和收割機(jī) ,只能 高效率 的模仿 ,卻很難 進(jìn)行 創(chuàng)造性 的自主 、獨(dú)立 工作 ,也就是說 目前 AI 在編程 領(lǐng)域 遠(yuǎn)未 達(dá)到 AlphaGo時(shí)刻 ,因此 在這個編程工具輔助 能力 極大 發(fā)展 ,基礎(chǔ) 底座 被云原生打造成 一片 坦途 的情況 下,復(fù)制粘貼 式的開發(fā) 將逐漸 失去 價(jià)值 ,但對于 程序員 創(chuàng)造力 與整合 能力 卻要求 更高 了。
在云原生時(shí)代 ,有兩種 開發(fā) 方向 ,一是 云原生的底層 基礎(chǔ) 開發(fā) ,這點(diǎn) 在上文的大數(shù)據(jù) 和AI 部分 已經(jīng) 詳細(xì)介紹 過了 ,底層 技術(shù) 關(guān)鍵在于 整合 與打通 ,性能 與資源 的開銷 是最需要 考慮 的方面 。
二是基于 云原生的開發(fā) ,這需要 對于 云原生各模塊 的進(jìn)行 創(chuàng)造 式的組合 ,從而 形成 新的生產(chǎn)力 。
由于 輔助工具 最擅長 的就是 模仿 與簡單 的修補(bǔ) ,這方面 AI 很可能比人類 程序員 強(qiáng)很多 ,因此 無論是 哪種 開發(fā) 方向 ,有創(chuàng)造力 的大神 級程序員 都會 比以往 更加 緊俏 。
人云 合一 ,方顯 原生 本色
去年 哈佛大學(xué) 孵化 的腦機(jī)接口創(chuàng)業(yè) 企業(yè) BrainCo也發(fā)布 了其最新產(chǎn)品 BrainOS,其主要 的創(chuàng)新點(diǎn)在于 腦機(jī)協(xié)同 的操作系統(tǒng) ;年初 華為發(fā)布了HarmonyOS2.0 操作系統(tǒng) ,主打 是端端 協(xié)作 的分布式 操作系統(tǒng) ;Codex、Copilot更是 將程序員 與AI 工具 結(jié)合 的大幕 正在 開啟 。
未來 ,人云 協(xié)同 將成為 云原生領(lǐng)域 的核心 ,而人云 協(xié)同 將推動 各行各業(yè) 的智能化 升級 。
不同于 數(shù)字化轉(zhuǎn)型 ,智能化 是以人為 中心 ,智能 需要 和人 協(xié)同工作 。
因此 ,也許 智能機(jī)器永遠(yuǎn) 都無法 取代 人,但人與 云達(dá)到 最完善 、最完美 的共融 共創(chuàng) 的云原生,終將 改變 每個 領(lǐng)域 、每個 行業(yè) 以及 每個人 的生活方式 。
作者 :馬超 ,CSDN 博客 專家 ,阿里云 MVP 、華為云 MVP ,華為 2020 年技術(shù)社區(qū) 開發(fā)者 之星 。