• <dd id="66mm4"></dd>
  • 楊強:隱私計算為何要開源?

    胡群2022-05-20 18:45

    經濟觀察網 記者 胡群  “如果隱私計算和聯邦學習技術只是掌握在少數寡頭的手里,我們還是得不到真正的數據流通,也得不到真正的數字經濟發展,因此必須把門檻降低,其中一個有效手段就是開源,能夠讓人人都可以使用這樣的技術,人人都能貢獻到這樣的技術。”楊強說。

    楊強是香港科技大學計算機與工程系講席教授、FATE開源社區技術指導委員會主席,今年4月,他又有了一個新身份——開放群島( Open Islands)開源社區執行主席。

    開放群島(Open Islands)是由深圳數據交易有限公司聯合國家智庫、國家單位、高校、大型金融機構、大型互聯網公司等多家發起單位牽頭成立的國內首個國際化自主可控隱私計算開源社區。

    隨著數字經濟的發展,數據已成為數字經濟基本的生存要素,而數據的安全高效可信可控流動則變得異常重要,隱私計算恰逢其時。5月11日,IDC發布消息稱,隱私保護計算入選《IDCTechScape:全球行業生態使能技術,2022》報告“變革型”技術曲線。同時入選的還有DAOs、區塊鏈、多接入邊緣計算等共六項技術。

    IDC調研發現,2021中國隱私計算市場規模突破8.6億元人民幣大關。從收入形態而言,市場收入主要來源于產品售賣或平臺建設方面,大量技術服務商的營收規模仍然處于億級以下水平。

    如何看待國內日漸火熱的隱私計算,為何要推動隱私計算開源,楊強接受了經濟觀察網記者的專訪。

    楊強表示,要保證數據的安全性,開源和透明是很好的方法,因為一個平臺是否有漏洞、后門,都會透明地打開給所有人看,大家都來觀察、督查,如有問題,大家會打補丁、必須把門檻降低。

    觀望冷靜期

    經濟觀察網:近年隱私計算概念較火,很多創業公司已獲得數輪融資,在金融領域中,多家大中型銀行也發布相關白皮書或研究報告,但成熟應用案例并不多,這是什么原因?

    楊強:首先我們要肯定資本市場積極支持隱私計算行業,并且真的是自己掏錢來支持是非??上驳?。同時很多技術人才投身其中,也是非常值得欽佩的。如果按照高德納(Gartner)技術成熟曲線,當前隱私計算已經歷初始的繁榮期,但現在是在一個比較觀望和冷靜的時期,大家有各種各樣的技術方案,卻發現在需求方沒有想象的那么熱烈。但我相信,市場需求方的熱烈時刻不久就會到來,這基于兩個先決條件。

    一是國內正在積極推動的數字經濟和數據要素市場。今年一月份,國務院辦公廳印發《要素市場化配置綜合改革試點總體方案》提到,探索“原始數據不出域、數據可用不可見”的交易范式,在保護個人隱私和確保數據安全的前提下,分級分類、分步有序推動部分領域數據流通應用。3月,《廣東省數字政府改革建設2022年工作要點》提出,探索運用區塊鏈、隱私計算等新技術強化數據安全防護。

    二是疫情倒逼很多公司開展線上化業務,催生出很多數字化機會。如果一個公司僅僅關注自己的技術而不去關注市場的走向、別人的需求,那么它往往會做出一些很高端的軟件,但使用者卻少之又少,我覺得這個現象并不奇怪。我們參考一下過去AI和互聯網,包括云計算技術等等,我們都看到這樣一種從激情走向理智的過程,現在隱私計算正在經歷這樣一個過程。

    經濟觀察網:為何隱私計算會成為互聯網、金融等行業熱門的技術?

    楊強:在過去幾年里,我們見證了機器學習在人工智能應用中迅猛發展,但機器學習需要很大的數據量訓練才能達到滿意的性能水平,而高質量、大數量的訓練數據很難獲得,我們不得不面對難以橋接的數據孤島。

    身處“數據時代”,如何有效挖掘數據中蘊藏的智能而不侵害數據本身的隱私和安全,是我們推動社會進步和生產力發展需要共同思考和實踐的課題。隱私計算的本質就是在實現“數據可用不可見”這一目標的過程中產生的一系列理論和技術。

    從二十世紀七八十年代誕生的基于隱藏部分信息來保護數據隱私的安全多方計算理論,到近年來圍繞“數據不動模型動”理念發明的聯邦學習技術、隱私計算的發展已歷經40多年。隨著人工智能在各行業的應用落地,人們對于用戶隱私和數據安全的關注度不斷提高。用戶開始更加關注他們的隱私信息是否未經許可,便被他人出于商業或其他目的而利用,甚至濫用。因此在歐美國家,互聯網機構率先使用隱私計算技術。而在中國,近年隨著《網絡安全法》《數據安全法》和《個人信息保護法》相關法律法規的進一步實施,已有很多互聯網、金融機構等企業由于泄露用戶數據而被重罰。

    如何在遵守更加嚴格的、新的隱私保護條例的前提下,解決數據碎片化和數據隔離的問題,是當前人工智能研究者和實踐者面臨的首要問題。倘若不能很好地解決這一問題,人工智能很有可能面臨新一輪的寒冬。

    在金融領域,一方面為了準確衡量一個用戶的資質,金融機構需要廣泛地利用各種數據,包括消費數據、工作數據和投資數據等,而這些數據往往分散在不同的機構中,例如工作單位、電商平臺、社交網絡和投資機構等;另一方面,對于金融機構,政府部門有著格外嚴格的數據安全監管,想要直接收集大量用戶的數據是不可行的。近年由于互聯網、金融等行業大規模應用隱私計算,使得隱私計算獲得了指數級的增長。

    但是,隱私計算不會在所有市場中同時獲得高速發展,我們看到目前國內除互聯網、金融行業外,智能終端如手機廠商特別有興趣引入隱私計算,并紛紛建立團隊做隱私計算,其中一個很大的動力在于它們的智能終端設備要進入歐美市場,要符合當地的法律法規。

    開源與產業生態

    經濟觀察網:為何要推動隱私計算開源?

    楊強:隱私計算、聯邦學習這些新技術主要的思想是數據可用而不可見,并且可控可計量、數據不出本地而知識可以出本地,但是知識也不曝露數據的隱私。就是我們所說的魚和熊掌其實可以兼得,如果我們把技術做好了就可以得到這樣的效果。

    如果要得到這樣的效果還需要開源技術的發展。如果隱私計算和聯邦學習技術只是掌握在少數寡頭的手里,我們還是得不到真正的數據流通,也得不到真正的數字經濟發展,因此必須把這個門檻降低,其中一個有效手段就是開源,能夠讓人人都可以使用這樣的技術,人人都能貢獻到這樣的技術。

    在隱私計算、聯邦學習的“商業化大網”中,安全、效率、有效性、普惠是緯線,開源生態主導的技術迭代與場景普及是經線。目前聯邦學習的算法更新迭代主要來自兩個動力:一是人工智能和隱私計算領域的大量研究,科研機構、人員不斷研究新情況、新漏洞和新算法,產出更多科研成果。同時,國際間的交流積極活躍,全球一流科研人員的匯集,成為技術發展的動力。

    第二個動力是開源社區的建設?;陂_源協作的形式,用戶、生態伙伴等更多角色的參與,使得技術接受更多維度檢驗的同時,也能夠建立起更加敏捷、全面的反應機制,隨時響應安全風險,極大提高了軟件算法的安全性與迭代效率。

    經濟觀察網:目前開源取得了什么效果?

    楊強:開源促進了隱私計算的“普惠”與價值共生。以國內首個聯邦學習開源社區FATE為例,FATE的開源開啟了國內隱私計算技術的開源浪潮,是全球首個工業級聯邦學習開源框架,有效降低了“聯邦學習”的技術門檻,為很多2020年及之后出現的聯邦學習產品的研發與應用提供了可靠的借鑒或參考。中國信通院調研統計顯示,55%的國內隱私計算產品是基于或參考了開源項目,其中以FATE開源項目為主。FATE開源社區加速了聯邦學習從“大廠”向小微B端企業的覆蓋與普及的同時,讓聯邦學習產業生態及參與方從“單兵作戰”走向生態化。

    目前,開源已成為大勢所趨,成為隱私計算產業生態核心組成部分。在FATE中,3000+的核心開發者通過社區能快速獲取有關如何解決業務問題的建議,并采用FATE開源框架及其30余個算法組件,搭建自身技術棧,利用社區的合力,讓技術的魯棒性、適配性、完整性得到全面的提升。而社區的維護者、開發者又能夠基于用戶實際業務的需求,進一步反哺技術與項目的迭代,價值共生。

    聯邦學習、FATE開源框架在保護數據安全方面的作用已經在大量實際應用中得到驗證,且運用成熟?,F階段,在多方數據合作的實際業務場景中,安全已不再是最大顧慮;重點轉向效率與有效性,或者說是如何在安全、效率、有效性間取得平衡:即在安全可靠的前提下,使效率與有效性最大化。在此背景下,我們提出了兼顧安全、效率、性能、可解釋性、普惠等方面的“可信聯邦學習” ,首次將安全、性能,效率等要素統一在共同的理論框架下。

    互聯互通,建立標準

    經濟觀察網:如果隱私計算要場景中廣泛落地,還面臨哪些障礙?

    楊強:首先,我們一開始更多地強調隱私計算使用的是哪一項技術,而不是特別關心要達到什么目的,所以可能一開始有點跑偏了。比如有些廠商特別強調隱私計算要使用多方計算才安全,使用其他的一些技術就不安全。其實事實不是這樣的,就好像在蓋一個房子一樣,任何一個技術其實只是一塊磚頭,如何把這個房子建好考驗的是我們對整體技術的把控,而不是一塊磚頭的軟硬決定整個房子的安全性。聯邦學習是把這些磚有機地結合起來,成為一個房子的設計方案。這個方案并不排斥任何一方的參與,我們管這個技術叫做可信聯邦學習或者可信隱私計算。

    其次,隨著隱私保護和合理使用用戶數據的法律法規取得了越來越多的進展,制定隱私保護的標準顯得愈加重要。比如A金融機構用的是一類技術,B用的是另一類技術,C可能是大數據公司,用的第三類技術。當大家想互聯互通的時候,卻發現這些技術之間很難溝通,所以現在提出統一大市場非常及時。

    隱私計算要按照一個標準搭建、按照一個標準設計,最后大家各自的方案都可以在一個標準下很容易地互通互聯。因此,我們在今年FATE社區里面提出一個重要的口號就是互通互聯,要促進各大廠商好幾十個不同的方案,非常非常難互通,我們要在這方面比別人多走一步,要讓他們的這些技術都能夠很容易地連接起來。

    然后,還需要建立標準,我們也在國際上建立了一個初始標準,國內在信通院的領導下也建立了很多的標準。但這些標準還遠遠不夠,更好的標準是能夠把技術和監管要求和法律連接起來,這樣的標準才是有用的標準,我們現在還缺乏這樣一種相互連接的標準。如果一個技術被認為滿足一個標準,那么它就可以合法使用,現在還沒有達到這樣一個目的,所以這是我接下來特別想推動的,就是把法律界、標準界、政府和技術開發人員請到一個桌子上讓大家討論,并達成共識。

    第三,現在大家談的都是數據,但是我認為未來的世界是模型的世界,當數據都不能出本地,流通知識的唯一載體就是模型。因此,可以想像以后不管是數據交易所還是業務的多方合作,流通的實體就是模型,所以模型的管理和模監管是非常重要的。

    版權聲明:以上內容為《經濟觀察報》社原創作品,版權歸《經濟觀察報》社所有。未經《經濟觀察報》社授權,嚴禁轉載或鏡像,否則將依法追究相關行為主體的法律責任。版權合作請致電:【010-60910566-1260】。
    金融市場研究院主任
    主要關注銀行、信托、fintech領域市場動態。
    性饥渴的老熟女视频
  • <dd id="66mm4"></dd>