指標與標簽有何不同?

0 評論 3869 瀏覽 14 收藏 15 分鐘

編輯導語:在如今的大數據時代,用數據說話更能體現出差異點,很多時候數據是最實際的表達手法,比如你的年度指標用數據來定義等等;除了這些之外,標簽也是重要的一點,如今標簽已經成為了各大企業都在做的一個目標;本文作者分享了指標和標簽有什么異同點,我們一起來看一下。

自從大數據概念開始興起后,好像人們都不怎么談指標了,而津津樂道于標簽。

數字經濟時代,談論指標真的落伍了嗎?其實未必!指標也好,標簽也罷,只要用好都能發揮其價值。

怎樣才能用好它們呢,我覺得要從懂它們開始;說到懂它們,就要清楚它們的異同點,到底指標和標簽有什么異同點呢?今天就來探討一下。

一、概念不同

指標是用來定義、評價和描述特定事物的一種標準或方式;比如:新增用戶數、累計用戶數、用戶活躍率等是衡量用戶發展情況的指標,月均收入、毛利率、凈利率等是用來評價企業經營狀況的指標。

標簽是人為設定的、根據業務場景需求,對目標對象運用一定的算法得到的高度精煉的特征標識。

可見,標簽是經過人為再加工后的結果;比如:說某個人是個“酒鬼”,這里“酒鬼”就是標簽,一看到“酒鬼”這個標簽人們就能很快知道,這個人肯定是經常喝酒、喜歡喝酒的人。

二、構成不同

指標通常由兩部分構成,即名稱和取值;名稱是指標的外在標識符號,取值是指標的具體內容。

指標名稱是對事物質與量兩方面特點的命名;指標取值是指標在具體時間、地域、條件下的數量表現。

當然,指標取值可以是定量的數值,有時候也可以是定性的描述;比如描述一個人時,性別、年齡、身高和體重是經常用到的指標,以體重是220斤為例,指標的名稱體重,指標的取值就是220斤;指標如果可以數量化的話,那么都是有單位或量綱的;從詞性上說,指標幾乎都是名字。

標簽通常就是簡單的幾個字或符號;還是以某人體重為220斤為例,用標簽的方式來描述的話,“大胖子”就是一個可用的標簽;標簽一般是不可量化的,通常都是形容詞或形容詞+名詞;比如“大胖子”就是形容詞+名詞的結構;標簽通常是孤立的,除了基礎類標簽,通過一定算法加工出來的標簽一般都沒有單位和量綱。

三、屬性與特征不同

1)指標是ICT時代和BI時代的通用語言

指標注重對事物及事件的過程進行全面的、體系化的描述,指標的描述范圍更廣泛,既包括過程也涵蓋結果;指標更注重與業務的結合,邏輯上更嚴謹,表現風格也比較嚴肅刻板;指標更側重業務化、嚴格化和數量化。

2)標簽是大數據與人工智能時代的通用語言

標簽比指標更有深度、更凝練,是對指標深度加工的結果;標簽注重人物和實體對象的描述,標簽一般側重對局部特征和結果的描述,注重與具體業務場景的結合,描述的范圍相對較窄; 標簽更側重生活化、口語化和符號化。

總之,標簽源于指標,卻高于指標;指標更理性,標簽更感性;標簽比指標更有趣、更形象化、人格化,更有畫面感,但指標比標簽更講求精確性、合理性、全面性和體系化。

四、價值評價方式不同

對指標與標簽的價值評估方式、評估內容與它們的應用場景相關,也與使用者的感受有關系。

對指標的價值通常用“好不好用”、“全不全面”來評價,對標簽的價值通常用“準不準”、“像不像”來評價。

指標的評價較易量化,通常有一定的標準和尺度;標簽的評價一般與使用者的感受、應用的結果有強關聯關系,不同的人、不同的應用場景,標簽能發揮的效果可能大相徑庭。

還有一點,由于標簽是指標進一步產品化的結果,指標是半成品,標簽是成品;所以,標簽有時候具有一定的商品屬性。

在大數據價值鏈上,標簽是可定價、可售賣、可交易的一種數據產品;比如:在個人征信服務領域,用戶的三要素、四要素在合規使用的前提下都是可以按條收費的;而指標通常是不具備售賣價值的,指標的價值可在具體應用場景里或者被融合到產品中才能體現出來。

對價值的認知上,指標可以按照重要性分為關鍵指標、一般指標等,或者說高價值指標、低價值指標之類的;而標簽較少提及這種說法,比如有關鍵指標一說,而沒有關鍵標簽一說。

五、分類不同

1)指標有很多種分類方式

比如:

  • 按照指標計算邏輯,可以將指標分為原子指標、派生指標、組合指標三種類型;
  • 按照對事件描述內容的不同,分為過程性指標和結果性指標;
  • 按照描述對象的不同,分為用戶類指標、事件類指標等;
  • 按照指標的變化頻率,分為靜態指標和動態指標;按領域劃分,有用戶類指標、收入類指標、行為類指標等;
  • 按照重要程度,分為主要指標和次要指標等;按職能來分,分為觀測指標、管控指標和挑戰指標。

當然,還有很多其它的分類方法,不再一一列舉。

2)標簽的分類方法通常比指標要少一些

之所以這么說,是因為指標能描述的對象范圍更廣,對事物的描述能做維度更全面、顆粒度更細,而標簽對事物(用于對人的描述比較多)的描述則是更深入、更形象的。

  • 按照標簽的變化性分為靜態標簽和動態標簽;
  • 按照標簽的指代和評估指標的不同,可分為定性標簽和定量標簽;
  • 按照標簽體系分級分層的方式,可以分為一級標簽、二級標簽、三級標簽等,每一個層級的標簽相當于一個業務維度的切面;
  • 按照復雜程度分為:基礎標簽、規則標簽和模型標簽——基礎標簽通常是寫實的,與指標有較高的重合度,比如身高、體重等;規則標簽一般是有一些簡單的規則來控制,符合某種規則時才生成相應的標簽;模型標簽一般需要通過某些機器學習算法來生成。

六、表現形態不同

指標的表現形態相對簡單,通常以格式化的報表、直方圖、趨勢圖、看板等圖形來表示。

標簽的表現形態相對復雜,我們通常說的標簽是數據化的標簽,數據化標簽的表現形態以可視化的圖表或大屏為主;比如,我們在客戶畫像時通常以詞云圖的形式來表現其特征。

事實上,在現實世界中標簽還有三種表現形態:實物標簽、網絡標簽和電子標簽。

  • 實物標簽是用于標明物品的品名、重量、體積、用途等信息的簡要標牌,例如:商品標簽、價格標簽、車檢標簽、服裝吊牌、車票、登機牌都是實物標簽;
  • 網絡標簽(Tag)是一種互聯網內容組織方式,是相關性很強的關鍵字,它能幫助人們通過關鍵詞快速建立對內容總體印象;
  • 電子標簽又稱RFID射頻標簽,是一種識別效率和準確度都比較高的識別工具,通過射頻信號自動識別目標對象并獲取相關數據,識別工作無須人工干預,可工作于各種惡劣環境。

七、生產過程不同

指標是生產性思維、拆解式思維,講究的是化整為零,將事物分解開來進行多角度的描述,得到很多的指標;標簽則是合成性思維、聚合式思維,講究的是化零為整,將多個分散的指標按照一定的原理進行綜合加工,得出概括性的結果。

一般情況下,先有指標,后有標簽;指標是業務管理導向的,需要提前規劃;標簽是應用導向的,跟隨業務需求的而變化,面向業務可隨時增加;

指標的生產通常先要掃平數據質量問題,統一數據口徑;而標簽生產涉及數據質量的問題較少,因為數據質量的問題已經在指標生產階段被解決了;指標通常存在多個口徑、口徑不一致的問題,而標簽在這方面的問題則相對較少。

八、應用場景不同

指標的應用場景很多,涉及企業的戰略、管理、運營和支撐等層面;具體包括:戰略目標、市場定位、業務監測、業績考核、任務分解、數據分析、數據建模、BI應用等。

標簽的應用場景主要集中于CRM領域,尤其適合于用戶運營。比如:客戶畫像、新增獲客、沉默用戶激活、存量客戶維系、數據建模、數據可視化等。

指標最擅長的應用是監測、分析、評價和建模,標簽最擅長的應用是標注、刻畫、分類和特征提取。

特別需要指出的是,由于對結果的標注也是一種標簽,所以在自然語言處理和機器學習相關的算法應用場景下,標簽對于監督式學習有重要價值,只是單純的指標難以做到的;而指標在任務分配、績效管理等領域的作用,也是標簽無法做到的。

九、管理與維護的內容不同

原則上來說,指標與標簽都需要建立體系化的管理機制。就指標的管理機制而言,指標管理通常涉及三個方面:需求階段的管理、開發過程的管理、應用過程的管理;所以,對指標的管理動作主要就是:做指標、管指標、控指標。

指標的日常管理涉及指標的定義、指標的分類、指標的權限管理等;對指標的監控與維護通常涉及缺失值、異常值、勾稽關系等方面的檢查。

對標簽的管理與維護通常按照標簽的生命周期來開展的,涉及標簽開發與發布、標簽應用、標簽價值評估和標簽優化及下線四個階段。

對標簽的管理動作主要就是:打標簽、貼標簽、用標簽和改標簽等;為做好標簽管理與維護,有必要設立專門的標簽管理團隊,建立標簽分類、命名、描述、和實施等方面的規范,完善配套的數據采集流程、標簽加工流程、標簽問題處理與反饋流程等;建立標簽全生命周期管理體系,與數據資產管理制度相統一,為標簽在各層面的落地及管理提供建設依據。

十、小結

以上是筆者從9個方面詳細解讀了指標與標簽的不同點。

當然,兩者還是有不少共同點的,比如:指標和標簽都是對事物的一種描述和解讀,都是對數據加工的結果,都可以分維度拆解,都是企業的數據資產等等,還有一些共同點就不再一一展開。

剖析指標和標簽的異同點是為了更好的使用它們、駕馭它們;所以,希望以上我關于指標與標簽的分析能夠對諸位有所啟發。

 

作者:黃小剛,微信公眾號:大數據產品設計與運營

本文由 @黃小剛 原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自Unsplash,基于CC0協議

給作者打賞,鼓勵TA抓緊創作!
更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!