- 基于調(diào)研文本大數(shù)據(jù)的機(jī)構(gòu)投資者行為研究
- 岳思詩(shī)
- 2243字
- 2024-05-23 14:59:49
1.3.3 研究方法和處理技術(shù)
本書的研究方法和處理技術(shù)如下。
(1)文獻(xiàn)分析法。
本書基于系統(tǒng)的文獻(xiàn)學(xué)習(xí),通過梳理經(jīng)典行為金融理論(behavioral financial theory)和中國(guó)儒家文化中的經(jīng)典思想,以及分析我國(guó)機(jī)構(gòu)投資者調(diào)研相關(guān)文獻(xiàn),確立研究重點(diǎn)。本書依據(jù)大量的文獻(xiàn)研究結(jié)果,結(jié)合本書的研究視角與內(nèi)容,分析開展研究需要的經(jīng)典理論與相關(guān)理論,追蹤前沿的研究動(dòng)態(tài),提煉研究思路與研究設(shè)計(jì),規(guī)劃研究的具體步驟;并且基于研究理論、研究思路與研究設(shè)計(jì)等前期工作,推進(jìn)后續(xù)研究。具體來說,筆者查閱了關(guān)于機(jī)構(gòu)投資者實(shí)地調(diào)研、投資者行為、文化觀念對(duì)行為決策的影響的相關(guān)文獻(xiàn),力圖對(duì)相關(guān)的文獻(xiàn)進(jìn)行全面了解,在掌握現(xiàn)有文獻(xiàn)的基礎(chǔ)上,對(duì)國(guó)內(nèi)外關(guān)于機(jī)構(gòu)投資者實(shí)地調(diào)研與投資者行為研究的文獻(xiàn)進(jìn)行歸納分析,同時(shí)結(jié)合當(dāng)前關(guān)于文化因素對(duì)投資者行為影響的相關(guān)文獻(xiàn),得出當(dāng)前這方面的研究還處于空白階段,并以此作為本書的突破點(diǎn)。只有較為全面地掌握了該領(lǐng)域的相關(guān)文獻(xiàn),才能為之后機(jī)構(gòu)投資者參與調(diào)研并根據(jù)調(diào)研信息進(jìn)行投資決策,以及該行為對(duì)上市公司發(fā)揮治理作用的研究假設(shè)的提出找到理論依據(jù)和文獻(xiàn)線索。這一方法貫穿全書。
(2)中文文本自然語(yǔ)言處理技術(shù)。
本書對(duì)典型機(jī)構(gòu)調(diào)研文本進(jìn)行人工語(yǔ)義標(biāo)注,構(gòu)建基礎(chǔ)經(jīng)營(yíng)管理特質(zhì)信息和表達(dá)行為語(yǔ)義庫(kù),結(jié)合無監(jiān)督、監(jiān)督分類和識(shí)別算法進(jìn)行小規(guī)模人工智能(AI)語(yǔ)義識(shí)別試驗(yàn),再抽樣進(jìn)行人工編校完善語(yǔ)義庫(kù);結(jié)合實(shí)證應(yīng)用結(jié)果反饋,補(bǔ)充完善經(jīng)營(yíng)管理特質(zhì)信息和表達(dá)行為內(nèi)容;選擇并改進(jìn)中文文本語(yǔ)義算法和模式,運(yùn)用Python軟件編寫標(biāo)注工具、機(jī)器學(xué)習(xí)算法和NLP應(yīng)用,進(jìn)行文本內(nèi)容信息的測(cè)度與計(jì)算。
具體地,首先,本書在Python語(yǔ)言中引入jieba程序包,依靠jieba自帶分詞詞庫(kù)和作者自定義分詞詞庫(kù)
對(duì)調(diào)研活動(dòng)信息文本進(jìn)行分詞,分詞結(jié)果為“詞語(yǔ)(詞組)+詞性”。然后,在Python中引入NLTK程序包
對(duì)所有調(diào)研活動(dòng)信息文本中的詞語(yǔ)(詞組)進(jìn)行詞頻統(tǒng)計(jì),并將詞頻由高到低排序,共得到詞語(yǔ)(詞組)127 521個(gè)。此外,剔除字?jǐn)?shù)小于2的詞語(yǔ)(詞組)、與金融市場(chǎng)無關(guān)的詞語(yǔ)(詞組),然后按照詞性將標(biāo)點(diǎn)符號(hào)(x)、連詞(c)、時(shí)間詞(t)、擬聲詞(o)、介詞(p)、量詞(q)、代詞(r)、語(yǔ)氣詞(y)剔除。最后,人工提取調(diào)研信息文本中關(guān)鍵詞語(yǔ)(詞組)。由3名研究方向?yàn)榻鹑谑袌?chǎng)文本分析的研究者將以上經(jīng)過篩選的金融市場(chǎng)詞語(yǔ)(詞組)進(jìn)行手動(dòng)提取,主要提取財(cái)務(wù)類、公司治理類、資本運(yùn)作、社會(huì)熱點(diǎn)、悲觀情緒及樂觀情緒類詞語(yǔ)(詞組),并將這3名研究者所提取的各類型詞語(yǔ)(詞組)取相同部分,形成調(diào)研活動(dòng)信息文本的各類詞語(yǔ)(詞組)的關(guān)鍵詞。該方法貫穿全書。本書構(gòu)建的具體詞庫(kù)內(nèi)容見附錄。
(3)統(tǒng)計(jì)分析法。
本書在進(jìn)行主要研究之前,先對(duì)樣本數(shù)據(jù),包括全樣本數(shù)據(jù)及各分樣本數(shù)據(jù),包括調(diào)研報(bào)告的特質(zhì)信息內(nèi)容、情感屬性內(nèi)容、機(jī)構(gòu)投資者特征變量、上市公司特征變量、控制變量進(jìn)行描述性統(tǒng)計(jì),獲得樣本數(shù)據(jù)的基本統(tǒng)計(jì)特征和分布規(guī)律,為后續(xù)的實(shí)證回歸提供前提條件。這一方法的應(yīng)用主要體現(xiàn)在本書的第3、第4、第5及第6部分。
(4)實(shí)證分析法。
本書使用機(jī)構(gòu)投資者所獲取的調(diào)研文本和我國(guó)A股市場(chǎng)數(shù)據(jù)展開實(shí)證研究,發(fā)現(xiàn)機(jī)構(gòu)調(diào)研文本的價(jià)值,分析機(jī)構(gòu)投資者是否做到調(diào)研信息獲取和投資決策的一致性行為,影響機(jī)構(gòu)投資者調(diào)研信息獲取和投資決策一致性行為的因素,以及該行為對(duì)上市公司盈余管理的影響,運(yùn)用R和Python軟件進(jìn)行分析。具體有以下三種分析方法:
①回歸分析法。研究核心部分——機(jī)構(gòu)調(diào)研文本的上市公司特質(zhì)信息價(jià)值發(fā)現(xiàn),機(jī)構(gòu)投資者所獲取調(diào)研文本內(nèi)容的特質(zhì)信息對(duì)市場(chǎng)收益具有預(yù)測(cè)作用,參考韋爾奇(Welch)和戈亞爾(Goyal)2008年、坎貝爾(Campbell)和湯普森(Thompson)2008年和蔣等人2019年等的研究框架,采用單變量預(yù)測(cè)模型、MSFE檢驗(yàn),考察調(diào)研文本對(duì)市場(chǎng)收益的預(yù)測(cè)能力;通過運(yùn)用最小二乘(OLS)分析機(jī)構(gòu)投資者是否根據(jù)調(diào)研信息進(jìn)行投資決策,以及該行為狀態(tài)對(duì)上市公司盈余管理的影響;采用邏輯回歸(Logistic Regression)探索影響機(jī)構(gòu)投資者根據(jù)調(diào)研信息進(jìn)行投資決策的因素;此外,采用兩階段最小二乘(2SLS)與Fama-Macbeth回歸進(jìn)行穩(wěn)健性檢驗(yàn)。這些方法的應(yīng)用主要體現(xiàn)在第3章、第4章、第5章及第6章。
②傾向得分匹配法(PSM)。隨機(jī)實(shí)驗(yàn)方法能夠解決變量間的因果關(guān)系,但是隨機(jī)實(shí)驗(yàn)方法難以在大多數(shù)社會(huì)研究中進(jìn)行推廣,這是因?yàn)槭艿浇?jīng)濟(jì)成本等因素的限制。因此傾向得分匹配法的興起解決了研究的內(nèi)生性問題,也保證了研究結(jié)論的可行性。該方法的基本思想是,在評(píng)估某項(xiàng)政策的效果時(shí),如果可以找到一個(gè)與處理組盡可能相似的對(duì)照組,則可以降低樣本選擇的偏倚。但是,在搜索對(duì)照組的過程中,僅使用一個(gè)特征不可能獲得令人滿意的匹配效果,因此需要通過多個(gè)匹配來完成,傾向得分匹配可將多個(gè)特征濃縮成一個(gè)指標(biāo),完成多元匹配。具體地,首先選擇協(xié)變量,其次使用邏輯回歸進(jìn)行傾向得分估計(jì),再進(jìn)行傾向得分匹配,在匹配時(shí)選擇兩大類方法,即最鄰近匹配法和整體匹配法,最后根據(jù)匹配后的樣本計(jì)算平均處理效應(yīng)(ATT)。計(jì)算傾向分值(PS)及平均處理效應(yīng)的公式在第4章中體現(xiàn)。
③主成分分析法(PCA)。主成分分析法將具有一定相關(guān)性的多個(gè)指標(biāo)轉(zhuǎn)換為互不相關(guān)的幾個(gè)綜合指標(biāo)。具體而言,將多個(gè)指標(biāo)轉(zhuǎn)換為幾個(gè)不相關(guān)的綜合指標(biāo),即將原始指標(biāo)進(jìn)行線性組合,并要求每個(gè)指標(biāo)都反映一定量的信息。原始指標(biāo)信息越多,方差越大,并且按照方差的大小進(jìn)行排序,這被稱為第一主成分,第二主成分……每個(gè)主成分彼此獨(dú)立。本書為了對(duì)機(jī)構(gòu)投資者的治理水平進(jìn)行評(píng)分,將多個(gè)機(jī)構(gòu)投資者的公司治理變量轉(zhuǎn)化為綜合治理評(píng)分,因此使用了主成分分析法。這一方法體現(xiàn)在第5章。
- 全國(guó)期貨從業(yè)人員資格考試輔導(dǎo)教材:期貨及衍生品基礎(chǔ)
- 股道酬勤:一本書讀懂中國(guó)股市
- 融資:奔向納斯達(dá)克
- 金融長(zhǎng)尾戰(zhàn)略:金融創(chuàng)新的長(zhǎng)尾風(fēng)險(xiǎn)與后全能銀行時(shí)代
- 股票投資入門與實(shí)戰(zhàn)精解
- 投資的邏輯:策略與實(shí)戰(zhàn)
- 消費(fèi)金融:下一個(gè)金融風(fēng)口
- 銀行數(shù)字化風(fēng)控:業(yè)務(wù)與實(shí)踐
- 偉大的博弈
- 投資核心資產(chǎn):在股市長(zhǎng)牛中實(shí)現(xiàn)超額收益
- 激進(jìn)市場(chǎng)
- K線炒股實(shí)戰(zhàn)從入門到精通
- 近代浙江地方銀行研究
- 祖魯法則
- 你可能不知道的金融真相:好讀、有趣、易學(xué)的金融常識(shí)