如何將半頁紙論文寫到十頁?

語言: CN / TW / HK

Datawhale乾貨 

作者:葉新武,上海財經大學,審稿:牧小熊

大家好呀~今天在Datawhale的群裡看到有些小夥伴在論文上苦苦掙扎,腦海中一下子浮現出各種論文擴充的“奇技淫巧”,突然發現自己在這方面有一些親身實踐過的方法,遂提筆希望能幫助到畢業困難的你(手動狗頭)。真是幹啥啥不行,水論文第一名。

沒問題

這篇文章是應上篇文章留言而生,理論上我們應該可以按照壓縮的方法將文章擴充回10頁(不禁讓人聯想反覆套娃是否會起到用軟體反覆翻譯中英文形成的奇妙效果)。但是事實上,很多同學的困難在於手中的半頁紙並不是壓縮凝練後的結果,只是......真的擠不出來了。所以,對於擴充(shui)論文這門手藝活,我們還需要分情況討論。

情況一: 時間不夠了

所剩時間的多少自然是首要問題,如果你就剩三四天,那麼最好還是採用一些急救措施。在沒有時間蒐集新的資料、多敲點程式碼的情況下,只能在文字上多下點功夫。

1. 蒐集研究領域相關文獻

這裡我們需要特別善於利用碩博學位論文,這是因為碩博學位論文往往由於學位的要求,有明顯的大而全的特點(字數多,內容詳細,參考文獻豐富),這是為了體現研究生在修讀期間在研究領域的整體情況。所以,建議大家寫本科論文就參考碩士論文,寫碩士論文就參考博士論文,寫博士論文就別指望這些小把戲能幫上忙了!(點進這篇文章的博士生都應該面壁五分鐘)

關於文獻檢索,最重要的當然是白嫖,只需要兩個工具就完全足夠了。中文:知網;英文:google scholar+sci-hub(https://www.sci-hub.ren/)。

a. 知網

知網應該大多數高校都有購買,如果實在沒有,就找小夥伴借個其他學校的vpn或者知網賬號吧。

b. google scholar+sci-hub

首先在google scholar上檢索相應的關鍵詞,會得到這樣的介面:

如果文章的右邊有 PDF 的按鈕,說明這篇文章可以直接下載,只需要點選就可以輕鬆下載。如果沒有的話就需要點進左邊的連結,會進入到期刊的官方網站,如果改論文是開源的就可以直接下載。如果不是的話,一般可以在頁面中找到文章的DOI號,樣式如下(每篇文章的樣式可能不完全一樣):

這裡的 10.1007/s00338-013-1051-z 就是我們需要的DOI號(只需要找到"10."開頭的一串就行),將這個DOI號複製到sci-hub的中搜索就可以檢索並免費下載相應的論文。如果實在沒找到DOI號也可以嘗試將標題輸入到sci-hub中檢索。

需要注意的是google scholar需要科學上網,如果在這方面有困難的話可以使用google scholar的國內映象。

2. 廣泛參考  做個勤勞的縫合怪

當需要在文字上下功夫的時候,綜述、研究背景、method這些方面往往是我們發力的大頭。

在我們蒐集到的文章中,可以將綜述整理出來進行整合串聯。首先可以根據閱讀多篇文章的綜述來確定綜述的整體框架,也就是在綜述中分小點,如果能夠對閱讀的論文的綜述框架進行整合是最好的。在確定框架後,由於時間關係,建議大家在綜述的每個小點中都按照時間順序,把閱讀的文章中的綜述串聯起來,注意要用自己的語言組織。而參考英文文獻的綜述就可以免去查重的煩惱。如此一來文獻綜述寫出三頁以上是綽綽有餘(估計還得控制一下筆墨才能只寫三頁hhh)。

研究背景同樣是一個可以著墨的地方,可以按照參考、自己組織邏輯的方法寫出一至兩頁。對於method來說,相信大家都知道對於絕大多數method而言,都可以大範圍調節method的理論描述,這是因為方法的提出到應用都經過了不少時間的發展,背後往往有很深厚的理論基礎,可以按照自己的需要來控制這部分的長度。

這邊簡單以線性迴歸模型舉個例子:當簡要介紹時,我們可以只寫出線性模型的公式和假設(甚至根據學科領域的不同,可以只寫出公式);但是同樣可以進行詳細的陳述,當你查閱了相關的理論書籍,相信你需要思考的是如何簡明扼要地描述方法,例如線性迴歸模型中可以陳述各種估計方法、統計診斷、估計引數的各種性質。

3. 善用視覺化和表格

如果說現有的半頁紙就是實證分析或者實驗部分的內容,那麼在這部分擴充字數雖然困難但是卻是最重要的,因為我們需要平衡整篇文章的結構,如果其他部分很多但是最核心的部分卻很少,會使湊字數十分明顯。那麼在這一部分,假定我們的時間緊迫到不能有任何實質上的內容上的擴充,我們需要儘可能地將結果通過圖表呈現,並儘量在結果分析中多寫一些內容。

關於圖表方面一些便捷好用的工具這裡務必給大家安利一下。

(1)表格

還記得用Latex做表格給人帶來的深深絕望,即使是用word做表格,如果表格很大很長的話,照樣能給人一種不管了延畢吧的衝動。論文中一般要求三線表格式,如果內容比較複雜的話,往往還需要控制各種豎線橫線的長度位置等等等等達到美觀、專業的效果,鑑於理工科論文的特點,這裡針對Latex而言給大家介紹一些工具。

a.各種R語言包

親身試過很好用的有:stargazer, textreg,可以用於將R語言使用各種包得到的統計分析結果輸出成Latex表格程式碼(一般是三線表,十分地道);還有xtable, sfsmisc,cwhmisc,可以將data.frame或者矩陣格式的資料輸出成Latex表格程式碼,這個理論上來說更有普適性,即使不是做統計分析,只要能將結果轉化為對應的格式,就可以輸出為Latex表格。類似的包有很多,這些包如果不能滿足大家的需要,請勤google哦(關鍵字:"latex in r")。

b.Python。 說到調包自然缺不了社群強大的python,python中也有相應的包——PyLaTeX,最重要的還是勤google(關鍵字:"latex python")。

c.還有一些可以將excel轉換為Latex的工具 ,但是不太建議,因為格式還是有億點點難以控制,使用起來效果並不好。

(2)圖片

科研圖片,講究兩個方面:醜和怪。醜又有兩個要素:畫素感和配色醜,如果能夠在你的圖片上出現不影響閱讀的畫素感,同時配色又有經過專家精心反向設計的效果,那麼絕對是一個滿分的圖片。對於怪,只要不同於常見的柱狀圖、條形圖、餅狀圖和箱線圖就足夠了,並不需要太過花哨,例如絲帶圖、小提琴圖就是一些在合理範圍內的"怪"圖,而南丁格爾玫瑰圖則顯得有點不太合適。

事實上,能夠畫出奇怪的醜圖的工具還是很難找的,畢竟滿足醜這一要求的視覺化工具最合適的一般是類似於R或者python語言的自帶函式。比較讓人滿意的還是得屬大家耳熟能詳的matplotlib——直男配色,不夠精緻,圖形型別足夠。下面簡單給大家展示一些matplotlib作常用圖片的程式碼:

a.散點圖

import matplotlib.pyplot as plt
import numpy as np

x = np.array([5,7,8,7,2,17,2,9,4,11,12,9,6])
y = np.array([99,86,87,88,111,86,103,87,94,78,77,85,86])

plt.scatter(x, y)
plt.show()

b.折線圖

xpoints = np.array([1, 2, 6, 8])
ypoints = np.array([3, 8, 1, 10])

plt.plot(xpoints, ypoints)
plt.show()

c.柱狀圖

x = np.array(["A", "B", "C", "D"])
y = np.array([3, 8, 1, 10])

plt.bar(x,y)
plt.show()

d.直方圖

x = np.random.normal(170, 10, 250)

plt.hist(x)
plt.show()

e.餅圖

y = np.array([35, 25, 25, 15])

plt.pie(y)
plt.show() 

這樣下來,加上最後的結論和分析,已經可以達到十頁的目標。但是話說回來,如果對研究的領域都沒什麼瞭解,雖然在標化的標準上寫夠了字數,還是要寄希望於答辯的時候遇到善良的老師。

情況二: 時間還比較充足

時間足夠的情況下,最好可以在已有的結果上再做實質性的擴充,文獻閱讀可以方法參考這篇,如果實在沒辦法,那麼跟時間不充足的情況相比,主要的不同就在於實證分析或者實驗的部分,其餘部分可以類似操作。

對於實證分析部分,可以多花一些時間做一些"平行工作",例如梯度下降演算法部分,可以蒐羅許多演算法都跑一遍;又例如統計學中的引數估計,可以使用各種估計方法,得出多個結果進行對比,如此一來便可以多出一些圖表,並進行文字闡述。進一步,可以在不同的環節採用這樣的策略,達到排列組合的效果。

三、寫在最後

總而言之,十頁並不是一個多高的要求,還記得上過的一門課的老師將論文上限定在十頁,防止大家卷個幾十上百頁,當時我也是廢了九牛二虎之力,用上雙欄、調整字號、各種壓縮才達到了小於十頁的要求。

還是希望大家在條件允許的情況下能夠儘量保質保量地完成一次研究、一份論文。畢竟,如果升學,這是對自己能力的一次鍛鍊;如果就業,你的畢業論文也大概率是面試官感興趣的部分。踏踏實實進行研究的小夥伴一定不會被虧待的~

葉新武

上海財經大學

微信影片號:熔岩巨獸武球王

論文必過, 三連