投行人必須會(huì)用的數(shù)據(jù)處理工具,你知道幾個(gè)?
當(dāng)實(shí)習(xí)中的你,被老板安排找到騰訊某股東占公司注冊(cè)資金的百分比數(shù)據(jù)。你卻一臉蒙圈不知道從何搜集數(shù)據(jù),硬著頭皮通宵整理完的數(shù)據(jù)又不知道如何快速整合,懷著忐忑的心情把Excel發(fā)出去,結(jié)果卻因數(shù)據(jù)不美觀被老板怒罵退回。
因?yàn)閷?duì)數(shù)據(jù)一無(wú)所知的你
被老板翻過(guò)幾個(gè)白眼?
今天,數(shù)據(jù)君就來(lái)教你KO數(shù)據(jù)的三大妙招,刷新老板對(duì)你的認(rèn)知
第一招:如何在3s內(nèi)獲取數(shù)據(jù)?一、搜集數(shù)據(jù)渠道
1.券商研究報(bào)告渠道
哪里才能獲得第一手投資研究報(bào)告?知名金融數(shù)據(jù)平臺(tái)像投行人必備的Bloomberg(彭博)和Factset是最常見(jiàn)的獲取數(shù)據(jù)的渠道。
Bloomberg
Bloomberg (彭博)是為大多數(shù)大型金融機(jī)構(gòu)提供服務(wù),用戶通過(guò)“彭博專業(yè)服務(wù)”可以查閱和分析實(shí)時(shí)的金融市場(chǎng)數(shù)據(jù)以及進(jìn)行金融交易。
彭博終端是一套讓專業(yè)人士訪問(wèn)“彭博專業(yè)服務(wù)”(Bloomberg Professional Service)的計(jì)算機(jī)系統(tǒng)。
彭博終端基于客戶—服務(wù)器架構(gòu)建立,服務(wù)器是一個(gè)多處理器的Unix平臺(tái),終端用戶使用的客戶端是一個(gè)Windows程序。
FactSet
FactSet研究系統(tǒng)是一家金融數(shù)據(jù)和軟件公司,為全球主要金融機(jī)構(gòu)的分析員、證券管理員和投資銀行家提供金融信息和分析軟件。
FactSet核心的優(yōu)勢(shì)主要集中在公司的財(cái)務(wù)數(shù)據(jù),這也是為什么它成為投行Anaylst必備技能之一的原因。
FactSet在投行中的使用頻率是Daily basis,而且FactSet個(gè)性化的界面,強(qiáng)大的功能,Excel plugin 也不差。
2.各大上市公司報(bào)告渠道
一些頂級(jí)咨詢公司如德勤、IBM、貝恩等都會(huì)發(fā)布annual report以及公司近況通常具有時(shí)效性,能系統(tǒng)地反映公司現(xiàn)狀,從而輔助投資的策略判斷。
3.上市公司公告渠道
主要包括美國(guó)SEC、香港披露易、中國(guó)巨潮咨詢查詢上市公司,對(duì)于高凈值個(gè)體或大型投資有輔助分析作用。
4.投行網(wǎng)站渠道
主要包括IPO、junling(巨靈)等渠道,多為華爾街咨詢、香港股票行情、金融建模及演示,可獲取各大投行現(xiàn)下投資組合分析及行情。
5.銀行業(yè)網(wǎng)站渠道
主要包括World Bank(世界銀行)、Forst(福斯特) 等各大知名銀行平臺(tái)渠道,可獲得實(shí)時(shí)銀行咨詢以及公告、數(shù)據(jù)的查找。
6.數(shù)據(jù)庫(kù)渠道
主要包括IEEE Xplore、EBSCO等,包含宏觀數(shù)據(jù)、金融、教育、行業(yè)數(shù)據(jù)等,并擁有完備的年度數(shù)據(jù)。
7.國(guó)外國(guó)家or經(jīng)濟(jì)體數(shù)據(jù)渠道
其中包括美國(guó)(提供了有關(guān)美國(guó)當(dāng)前經(jīng)濟(jì)形勢(shì)的描述和主要宏觀經(jīng)濟(jì)變量數(shù)據(jù))和經(jīng)濟(jì)合作與發(fā)展組織數(shù)據(jù)(提供了成員國(guó)的金融數(shù)據(jù),但也包括一些總體數(shù)據(jù),比如GDP、失業(yè)和通貨膨脹等)。如Heston-Summers數(shù)據(jù)庫(kù)、《當(dāng)代商業(yè)縱覽》等。
8.綜合性數(shù)據(jù)渠道
各類財(cái)經(jīng)、股票、經(jīng)濟(jì)類數(shù)據(jù)庫(kù),如產(chǎn)品價(jià)格指數(shù)(PPI)詳細(xì)報(bào)告,國(guó)際股票市場(chǎng)數(shù)據(jù)庫(kù),聯(lián)合國(guó)統(tǒng)計(jì)年鑒等等,提供宏觀經(jīng)濟(jì)信息、行業(yè)(產(chǎn)業(yè))發(fā)展報(bào)告、企業(yè)(公司)信息、產(chǎn)品市場(chǎng)分析,大量表格和統(tǒng)計(jì)數(shù)據(jù),以及很多相關(guān)站點(diǎn)的鏈接,內(nèi)容從收入、財(cái)富到貧困問(wèn)題都有。
9.策略常用網(wǎng)站渠道
國(guó)內(nèi)常用財(cái)政部、發(fā)改委等官方網(wǎng)站來(lái)了解政府政策及實(shí)時(shí)咨詢,分析當(dāng)前社會(huì)及資本浮動(dòng)情況;國(guó)外常用BEA、CBO等了解股票、財(cái)政等等詳細(xì)數(shù)據(jù)和實(shí)時(shí)分析。
10.搜索引擎渠道
主要包括谷歌、BASE、sciseek等搜索引擎,多用于查找、搜索資源,能準(zhǔn)確定位你想要的數(shù)據(jù)。
二、使用程序語(yǔ)言自動(dòng)抓取網(wǎng)絡(luò)數(shù)據(jù)在數(shù)據(jù)獲取領(lǐng)域中,最為被廣泛使用的就是python語(yǔ)言,俗稱爬蟲(chóng)。
通過(guò)爬蟲(chóng)加正則這種自動(dòng)化的工具,能夠耗很少的人工就可以將數(shù)據(jù)和信息采集并結(jié)構(gòu)化,后續(xù)通過(guò)更多的分析工具完成許多有商業(yè)價(jià)值的分析并獲取所謂的insight(將信息轉(zhuǎn)化為知識(shí)和洞察)。
推薦使用網(wǎng)站:regex101.com
示例:爬取社交網(wǎng)絡(luò)數(shù)據(jù):Facebook
Facebook提供了API,可以提交關(guān)鍵字等信息爬取搜索結(jié)果中的每一條內(nèi)容。
第二招:如何清理數(shù)據(jù)?1.萬(wàn)能的Excel
Excel是迄今為止最簡(jiǎn)單最便捷的處理數(shù)據(jù)方式。下至四則運(yùn)算,上至各類統(tǒng)計(jì)分析、矩陣運(yùn)算及線性規(guī)劃都可以搞定。但是想在投行借excel玩出花樣,千萬(wàn)不要以為會(huì)了VLookup及一些快捷鍵就可以耀武揚(yáng)威了,至少需要把矩陣乘法、向量乘法、Offset/ Cells/ Row/ Range等函數(shù)用到極致,這樣大多數(shù)Financial Model會(huì)做得非常靈活,而且各種數(shù)據(jù)查詢及匹配工作會(huì)達(dá)到部分SQL的處理水平。
2.進(jìn)階版Excel:VBA
VBA會(huì)讓Office的能力提升一個(gè)檔次,除了完成函數(shù)不能完成的一些任務(wù),最有價(jià)值的是能夠在Office的各套軟件之間實(shí)現(xiàn)信息同步。
學(xué)習(xí)Excel VBA較為正規(guī)的圖書是 John Green的 Excel 2007 VBA Programmer’s Reference,中文版由Excel Home翻譯為《Excel 2007 VBA參考大全》。這本書應(yīng)至少閱讀完前7章。閱讀完前4章即可以嘗試解決工作中遇到的問(wèn)題了。
第三招:如何完美地呈現(xiàn)數(shù)據(jù)當(dāng)數(shù)據(jù)清理完畢后,如果你直接呈現(xiàn)給Boss,那就糟了!你知道美化前后的數(shù)據(jù)的差別有多大?
前者是一個(gè)落魄的流浪漢,后者成了一個(gè)精英,雖然還是同一個(gè)人,但明顯視覺(jué)感受迥然不同。而且最重要的是美化后的表格能帶來(lái)80%的溝通效力。
如何美化數(shù)據(jù)?數(shù)據(jù)可視化,了解一下,它主要是借助于圖形化手段,清晰有效地傳達(dá)與溝通信息。
數(shù)據(jù)可視化技術(shù)包含以下幾個(gè)基本概念:
①數(shù)據(jù)空間:是由n維屬性和m個(gè)元素組成的數(shù)據(jù)集所構(gòu)成的多維信息空間;
②數(shù)據(jù)開(kāi)發(fā):是指利用一定的算法和工具對(duì)數(shù)據(jù)進(jìn)行定量的推演和計(jì)算;
③數(shù)據(jù)分析:指對(duì)多維數(shù)據(jù)進(jìn)行切片、塊、旋轉(zhuǎn)等動(dòng)作剖析數(shù)據(jù),從而能多角度多側(cè)面觀察數(shù)據(jù);
④數(shù)據(jù)可視化:是指將大型數(shù)據(jù)集中的數(shù)據(jù)以圖形圖像形式表示,并利用數(shù)據(jù)分析和開(kāi)發(fā)工具發(fā)現(xiàn)其中未知信息的處理過(guò)程。
數(shù)據(jù)可視化主要用于以下兩方面:
①報(bào)表類,如JReport,Excel,F(xiàn)ineReport,ActiveReports報(bào)表等。
②BI分析工具,如Style Intelligence、BO,BIEE,帆軟FineBI等。
③國(guó)內(nèi)的數(shù)據(jù)可視化工具,有BDP商業(yè)數(shù)據(jù)平臺(tái)-個(gè)人版,大數(shù)據(jù)魔鏡,數(shù)據(jù)觀,F(xiàn)ineBI商業(yè)智能軟件等。
1.Excel
Excel的圖形功能并不強(qiáng)大,但Excel是分析數(shù)據(jù)的理想工具。
作為入門級(jí)工具,Excel是快速分析數(shù)據(jù)的理想工具,也能創(chuàng)建供內(nèi)部使用的數(shù)據(jù)圖,但是Excel在顏色、線條和樣式上可選擇的范圍有限,這也意味著用Excel很難制作出能符合專業(yè)出版物和網(wǎng)站需要的數(shù)據(jù)圖。
但是作為一個(gè)高效的內(nèi)部溝通工具,Excel應(yīng)當(dāng)是你百寶箱中必備的工具之一。
2.Chart.js
JsChart組件功能強(qiáng)大,能適應(yīng)各種復(fù)雜的需求和業(yè)務(wù),而且操作起來(lái)相對(duì)簡(jiǎn)單。
3.Google Chart API
Google Chart API工具中取消了靜態(tài)圖片功能,目前只提供動(dòng)態(tài)圖表工具。但Google Chart的一個(gè)大問(wèn)題是:圖表在客戶端生成,這意味著那些不支持JavaScript的設(shè)備將無(wú)法使用,此外也無(wú)法離線使用。
當(dāng)然,Google chart API還是很強(qiáng)大的,在線自動(dòng)幫你將所需要的數(shù)據(jù)匯總成,各式各樣的圖標(biāo),折線 餅狀 柱狀 氣泡等等。
4.Echarts
Echarts是一款開(kāi)源、功能強(qiáng)大的數(shù)據(jù)可視化產(chǎn)品??梢粤鲿车倪\(yùn)行在 PC 和移動(dòng)設(shè)備上,兼容當(dāng)前絕大部分瀏覽器(IE8/9/10/11,Chrome,F(xiàn)irefox,Safari等),底層依賴輕量級(jí)的矢量圖形庫(kù) ZRender,提供直觀,交互豐富,可高度個(gè)性化定制的數(shù)據(jù)可視化圖表。
5.D3
D3(Data Driven Documents)是支持SVG渲染的另一種JavaScript庫(kù)。但是D3能夠提供大量線形圖和條形圖之外的復(fù)雜圖表樣式,例如Voronoi圖、樹(shù)形圖、圓形集群和單詞云等。D3想要入門不是太簡(jiǎn)單,至少都要有HTML和JavaScript基礎(chǔ)才行,對(duì)JavaScript的DOM要求也有點(diǎn)高。
6.Crossfilter
Crossfilter 是一個(gè) JavaScript 類庫(kù),能夠在瀏覽器端對(duì)大量數(shù)據(jù)進(jìn)行多維分析。Crossfilter既是圖表,又是互動(dòng)圖形用戶界面的小程序,當(dāng)你調(diào)整一個(gè)圖表中的輸入范圍時(shí),其他關(guān)聯(lián)圖表的數(shù)據(jù)也會(huì)隨之改變。它可以在不同的 Group By 查詢之間實(shí)現(xiàn)“交叉過(guò)濾”,自動(dòng)連接和更新查詢結(jié)果。
7.R語(yǔ)言
R語(yǔ)言是主要用于統(tǒng)計(jì)分析、繪圖的語(yǔ)言和操作環(huán)境。R是屬于GNU系統(tǒng)的一個(gè)自由、免費(fèi)、源代碼開(kāi)放的軟件,它是一個(gè)用于統(tǒng)計(jì)計(jì)算和統(tǒng)計(jì)制圖的優(yōu)秀工具。它可以運(yùn)行于UNIX,Windows和Macintosh的操作系統(tǒng)上,而且嵌入了一個(gè)非常方便實(shí)用的幫助系統(tǒng)。
8.jsDraw2DX
用于創(chuàng)建任何類型的交互式圖形 SVG (舊 IE 瀏覽器是 VML ) 的一個(gè)獨(dú)立 JavaScript 庫(kù)。除了生成所有基本形狀像線、 矩形、 多邊形、 圓、 橢圓、 圓弧等,庫(kù)包可以繪制曲線、 貝塞爾曲線 (任何 degree )、 函數(shù)圖形、 圖像和文本的裝飾。
9.Visual.ly
如果你需要制作一個(gè)快速的視覺(jué)圖像,你沒(méi)有必要再詢問(wèn)專業(yè)的設(shè)計(jì)團(tuán)隊(duì),你可以自己完成這些工作。Visual.ly就是最流行的一個(gè)選擇。其中提供了大量信息圖模板。
查找數(shù)據(jù)、處理數(shù)據(jù)、美化數(shù)據(jù)的工具都在這了
你平時(shí)用過(guò)哪幾種呢?
學(xué)會(huì)其中一兩種
分分鐘KO各種數(shù)據(jù)
還怕不能升值加薪?