第50節 對應分析

正如剛才網友KonKurosaki所說,二狗這個職業最需要創造力和準確的分析力(比如在不同細分市場的研究),那麽好,二狗現在就來個gangstersegmentation。

二狗的確也曾為如何界定拜金流氓,如何論證古典流氓和拜金流氓的區別費盡了心思。剛才在翻看二狗上個月自己做的一個報告時豁然開朗,原來,論證古典流氓和拜金流氓的方法就寫在這個報告裏,這個方法的名字就叫“對應分析法”,(correspondenceanalysis),這是二狗這個職業常用的分析方法。

這是一種數學分析方法,對數學沒有興趣或者沒有耐心的童鞋,可以跳過本節不看。

先從網上抄一段關於對應分析的解釋:對應分析主要主要用於分析二維數據陣中行因素和列因素間的關系,是一種多元相依變量統計分析技術,是通過分析由定性變量構成的交互匯總數據來解釋變量之間的內在聯系的。同時,使用這種分析技術還可以揭示同一變量的各個類別之間的差異以及不同變量各個類別之間的對應關系。

二狗職業習慣是習慣於用圖說話,用數據說話,但是天涯沒有PPT功能,否則二狗弄出個散點圖來可以解釋的更詳盡些。

廢話不多說,進入主題。

文章的開篇二狗把流氓分成四類:古典流氓、拜金流氓、黑社會性質的流氓、黑社會。

這四個根據時代劃分的流氓團體肯定具備一些共性,但,毫無疑問,他們也都有各自的個性,如何以他們這些不同的個性屬性將他們分類呢?二狗當然有辦法,現在二狗就設定一系列可以形容這四類流氓的描述性詞語作為變量:目無王法、為錢不要命、重義氣、可以為小沖突玩命、心狠手辣、勾結政府或司法機關的腐敗分子、有大俠風範、為兄弟出頭拼命、沒有利益的事兒不會去做、窮光蛋也能當老大、打架為揚名、心中正義感強、只會背後下黑手、喜歡群架會戰、願意單挑、為錢可以出賣兄弟、有錢才能當老大、熟讀法律……二狗隨手寫下了這麽多變量,變量越多,越容易界定。

然後,二狗把這些設計成一份問卷,進行問卷調查,然後整理數據,統計數據(具體過程不敘述,太麻煩),經過二狗的統計分析,呈現在大家面前的,將會是一張散點圖,這張散點圖上有一群小點,但這群小點只有兩個顏色,一個紅色,一個綠色(俺們東北人喜歡大紅大綠的)。

紅色的點是二狗剛才說的那些描述四個時代流氓的變量如目無王法等等等等。

綠色的點只有四個,分別是古典流氓、拜金流氓、黑社會性質的流氓、黑社會。

好了,整個描述四個時代流氓團體的圖,就呈現在大家眼前了,就是這麽簡單,就一張圖。

二狗就算寫200萬字,對整個中國黑社會變遷的描述也沒這張圖精確。盡管二狗沒有做過這個調查和統計,但是二狗有這自信:憑借二狗在過去20多年來對身邊黑社會成員的了解和處理數據的經驗,完全可以想象出這圖是什麽樣的,盡管是主觀的臆想,但精確程度應該相當不低。而且,遠比文字敘述更加直觀。

圖是被二狗臆想出來了,如何來分析這張圖呢,方法很簡單,雖然這張圖上滿是淩亂的散點,但是由於二狗設的變量很多,所以可以很清楚的界定這四個時代的流氓,界定的方法是根據圖中“綠色的點”和“紅色的點”的距離,可以用歐式距離公式計算其關系的密切程度,紅綠兩個點的距離越接近就說明某種流氓特有的屬性更接近於某個時代的流氓團體。

根據兩點間的遠近關系進行判斷,這就完美的解決了不同時代流氓團體的有部分屬於共性但又有不同個性的問題。

在圖中我們可以清楚的發現:

和古典流氓這個綠色的點距離最接近的屬性是:目無王法、重義氣、有大俠風範、願意單挑、心中正義感強、窮光蛋也能當老大、為兄弟出頭拼命……

好了,二狗用個紅圈這些距離相近的點劃起來,告訴大家,這就是古典流氓最具特征的屬性。

和拜金流氓這個綠色的點距離最近的屬性是:為錢不要命、心狠手辣、有錢才能當老大、可以為錢出賣兄弟、沒有利益的事兒不會去做………………

好了,二狗再用個紅圈把這些距離相近的點圈起來,告訴大家,這就是拜金流氓最具特征的屬性。

至於黑社會性質的流氓和黑社會這兩個時代的流氓對應的屬性究竟是怎麽樣,二狗暫且不寫。畢竟,後面還有兩部。

二狗想起前段時間曾和文中第三部和第四部出現的一位叫先哥的江湖中人酒後聊天,他也是二狗很好的朋友。(東北話先哥要讀成先兒哥,帶兒話音。)