導讀

  它山之石,可以攻玉。為了幫助各界人士學習國外先進經驗,進一步了解大數據市場的定價、交易與保護,國脈戰略研究院專家楊冰之、林渠,帶來了《大數據市場調查:定價、交易與保護》的翻譯文章,相信會給大家以思想的碰撞、靈感的啟迪,促進大家思考,從而為我國推進數據要素市場化配置改革,貢獻國脈戰略研究院的智慧。本文為《大數據市場調查:定價、交易與保護》連載系列文章第六篇,也是最后一篇。

  隨著傳統媒體日益數字化,內容越來越多地存儲在數字卷中,而不是傳統內容(電影、報紙、設計圖紙、客戶信息、辦公室文檔等)。換言之,商品正在從實用物品轉變為虛擬物品。這樣,內容很容易分發和復制。因此,數據保護成為確保數據所有權的關鍵條款。數據定價、數據交易和數據保護構成了一個相互影響的三維閉環。為了實現數據所有者的最大利潤和數據的最大價值,數據保護是不可分割的一部分。下面,我們將討論大數據生命周期的最后一個重要階段,即數據保護。

  A.數字版權管理

  建立數字版權管理(DRM)是為了防止數字內容被故意復制、共享和竊取,更重要的是作為數字版權保護發展的指導方針。2001年初,W3C成立了第一個DRM集團,作為參與全球數字版權管理的標準組織。實現DRM的解決方案多種多樣,包括XrML版權表達語言、Microsoft DRM、Apple HLS DRM、Adobe Flash access DRM、RealNetworks Helix DRM和OMA DRM規范。

  所有這些DRM解決方案都需要五個關鍵組件:(i)安全性。它著重于內容的加密以及為數字內容創建哈希、水印和數字簽名;(ii)訪問控制。它負責身份和訪問管理,并為需要訪問受保護數字內容的用戶提供憑據。此外,該組件監視授權用戶的行為,并為不同用戶設置不同的訪問權限;(iii)使用控制。它監視每個授權用戶的使用情況,并將使用情況記錄為歷史記錄;(iv)許可證管理。它向授權用戶發布許可證(密鑰、XrML文件、身份驗證代碼),并控制和檢查許可證的生命周期(有效期);(v) 付款管理。此組件與使用控制一起工作,并計算用戶需要支付的費用。這是數字商務的主要目標。

  我們以Microsoft DRM為例來解釋DRM的工作原理。如圖7所示,匿名用戶嘗試訪問內容服務器(content server)以播放或下載某些內容,這些內容受DRM服務器保護。他或她首先向個性化服務器發送請求。然后服務器檢查個性化客戶端設備上的應用程序。如果有應用程序正在運行,應用程序將向DRM服務器發送許可證要求。個性化應用程序是一個客戶端DRM軟件,稱為個性化黑盒(IBX)。如果沒有此軟件,DRM服務器將無法釋放解密內容的許可證。為了滿足IBX的要求,DRM服務器釋放加密的許可證。當用戶試圖解密許可證時,IBX保護敏感信息,這種過程稱為個性化。釋放許可證后,DRM服務器將檢查用戶狀態。如果這是第一次訪問服務器,DRM將要求用戶加入域。不同的域區分特定用戶的內容和權限。這就是DRM實現訪問控制的方式。最后,允許用戶訪問內容服務器(content server),內容服務器會發回內容。

圖片

  (圖7. Microsoft數字版權管理工作流)

  B. 數字版權管理模型

  根據不同的數字內容,我們將DRM模型分為以下三類:(i)基于軟件的DRM,(ii)基于多媒體的DRM,以及(iii)基于非結構化數據的DRM。

  1) 基于軟件的數字版權管理

  最常見的DRM是基于軟件的DRM,因為軟件是計算機上使用最廣泛的應用程序。軟件屬于數字商品,易于復制和重新制作,成本為零。因此,軟件開發公司通常設計保護版權和防止盜版入侵的機制。最佳的DRM機制可以記錄安裝時間和PC標識信息,并支持多個安裝和主機。

  涉及的主要方法有兩種:在線身份驗證和離線身份驗證。對于在線身份驗證,當用戶開始安裝過程時,軟件首先檢查Internet連接。如果存在Internet連接,軟件將向DRM服務器發送身份驗證請求,如上面討論的常見DRM策略中所述。否則,安裝將在沒有Internet連接時停止,或者只安裝SoftwareDemo。脫機身份驗證比聯機身份驗證更重要。如果不支持脫機DRM,本地許可證文件將很弱,并且很容易解密。許多研究工作集中于離線身份驗證。例如,Reavis Conner和Rumelt提出了一個成本函數來衡量解密的復雜性。如果解密成本大于此函數確定的價格,則軟件是安全的。Barapatre等人提出了一種結構,以增加解密許可證文件的復雜性。該模型使用靜態和動態代碼的代碼注入和軟件版權保護(SCP)技術對許可證文件進行加密,以保護原始軟件。在軟件層和許可證層(許可證文件、硬件令牌管理文件、庫文件等)之間引入了保護動態鏈接庫(DLL)層。因此,用戶不能直接訪問認證信息。

  2) 基于多媒體的數字版權管理

  多媒體是數字商品最重要的組成部分。超過80%的互聯網流量專用于視頻內容。因此,帶來的巨大的挑戰是如何妥善保護多媒體內容的版權。一般來說,加密和水印技術就是在這個方向上使用的。軟件和多媒體(視頻和音頻)的最大區別在于在線流媒體。在線視頻和音頻支持實時協議(RTP)/實時流協議(RTSP),以實現在線流,并且在某些情況下,需要支持組域身份驗證(家庭成員、企業用戶等)。通常,對手會在主機上運行惡意客戶端來中斷和監視流,以分析加密密鑰。為了解決這個問題,大衛(David)和扎登伯格(Zaidenberg)提出了一種使用選擇性視頻解密的方案,以確保內容的安全性,同時減少加密時間。此外,選擇性解密是高效視頻加密的一種變體,并且所提出的算法僅對變換參數的符號位進行操作。它不需要額外的空間,并且由該算法加密的流產生H.264比特流。同時,該方案通過限制訪問狀態將加密過程推進到一個安全的環境中。例如,用戶要么處于加密狀態,要么處于解密狀態,但不能同時處于兩種狀態,這是禁止的。

  此外,水印技術已廣泛應用于視頻和音頻DRM中。將水印嵌入視頻內容需要對視頻內容進行完全解碼。這是一個關鍵問題,因為這一過程需要大量計算資源,并降低了視頻質量。為了避免隨著視頻比特率的增加而增加嵌入水印的復雜性,提出了一種基于H.264編解碼器標準的盲水印算法。請注意,H.264是基于運動補償的高質量編解碼器標準。H.264標準使用幾個宏塊以及每個宏塊的亮度和色度(Cb和Cr)來表示幀,。水印算法掃描宏塊并選擇最優預測模型。因此,根據H.264的特點,盲水印算法將水印權利嵌入到所選宏塊中,防止共謀攻擊,并在解碼過程中保持視頻質量。

  有研究提出了另一種水印算法,該算法適用于基于深度圖像渲染(DIBR)的三維視頻內容。傳統的水印系統要么會破壞三維視頻,造成不可逆的變形,要么容易受到攻擊,而本文提出的綜合Duns水印算法克服了這些問題。所設計的算法基于偽三維離散余弦變換(3D-DCT)和量化索引調制(QIM)將水印嵌入深度圖中,提高了水印的魯棒性,避免了對視頻內容的破壞。值得注意的是,圖像也被視為多媒體內容,類似于視頻和音頻內容,水印技術是保護版權的最常用方法。對于基于圖像的水印系統,通常使用離散小波變換(DWT)、最小有效位(LSB)和離散余弦變換(DCT)算法將水印嵌入到安全密鑰中。此外,可以在一幅圖像中嵌入多個水印。此外,水印方案已被用于追蹤匿名互聯網惡意流量,以識別惡意來源,用于取證。

  3) 基于非結構化數據的數字版權管理

  非結構化數據,如Microsoft Word文檔、PDF文檔、各種數據庫、源代碼等,都是可以方便地傳播和存儲的數字化數據。盡管如此,它是脆弱的,并且很難防止故意復制和篡改非結構化數據。此外,非結構化數據通常具有很高的商業價值,并且包含敏感信息,這些信息的泄漏將導致數據所有者的嚴重損失。因此,非結構化數據保護是當今的一個熱門話題,也稱為數據泄漏保護(DLP)。非結構化數據DRM與其他類型的DRM完全不同,因為數據易于操作和損壞。因此,加密作為一種最安全的方法,通常用于保護非結構化數據。盡管如此,隨著數據規模的不斷擴大,加密過程的成本將繼續增加。例如,史(Shi)等人提出了一種基于概率數據結構(Bloom Filter)的保護方案。該方案將狀態記錄到帶有正標記或屬位標記的矩陣Bloom過濾器中。該方案包括一個分析器,用于分析和掃描內容。與加密方案相比,該方案具有更好的性能。

  總之,在本章節,我們闡述了三種數字版權管理模式,并討論了每種模式的現有相關方法。不同類型的數字內容管理,即基于軟件的數字版權管理、基于多媒體的數字版權管理和基于非結構化數據的數字版權管理,已經有了很好的探索。可以看到,數字管理技術是保護大數據不被竊取和復制的關鍵方法。盡管如此,隨著數字內容的快速增長和大數據的交易屬性,現有數據保護方案和更先進技術的可行性有待進一步研究。

  七、 結論

  本文討論了大數據交易的問題。具體而言,我們首先講述了與大數據相關的現有研究,并確定了數據交易的大數據生命周期,包括數據收集、數據分析、數據定價、數據交易和數據保護。然后,講述了與大數據定價相關的現有工作。關于數據定價,闡明了它的重要性,對不同的市場結構、數據定價策略和數據定價模型進行了分類,然后列出了每種類型的優勢和局限性。對于數據交易流程,我們概述了與數據交易相關的關鍵問題及其可能的解決方案。我們進一步研究了拍賣策略,詳細說明了不同的方案、交易平臺和相關問題。最后,研究了作為大數據生命周期最后階段的數據保護。對現有版權保護方案進行了分類,并概述了大數據版權保護面臨的挑戰。本次調查的主要目的是對大數據交易有一個清晰而深入的了解。我們概述了與數據定價、數據交易和數據保護相關的廣泛主題,并強調了尚未解決的領域,以進一步促進大數據的研究和開發。

更多精彩,請關注“官方微信”

11.jpg

 關于國脈 

國脈,是大數據治理、數字政府、營商環境、數字經濟、政務服務專業提供商。創新提出"軟件+咨詢+數據+平臺+創新業務"五位一體服務模型,擁有超能城市APP營商環境流程再造系統、營商環境督查與考核評估系統、政策智能服務系統、數據基因、數據母體等幾十項軟件產品,長期為中國智慧城市、智慧政府和智慧企業提供專業咨詢規劃和數據服務,廣泛服務于發改委、營商環境局、考核辦、大數據局、行政審批局等政府客戶、中央企業和高等院校。

責任編輯:wuwenfei