10
2019.08
聰明反被聰明誤 - Excel 影響基因研究的正確性
原創文章 引用請註明出處
Excel 提供科學研究者一個簡單操作易於研究的工具,可以方便地用於檢視表格、資料篩選、統計與繪圖等,但 Excel 常因太過"聰明"而自動轉換成不正確的結果,例如:基因名稱或資料庫編號,根據統計有大量的論文與公開資料庫上出現名稱轉換上的錯誤,這問題嚴重影響了生命科學領域研究結果的正確性。(詳見先前報導:都是Excel惹的禍-20%的基因體研究論文出錯)。
名稱轉換錯誤的問題對於 Genome 或 RNA-seq (or Microarray) 分析而言都是個災難,因此在 2017年 PLoS One 發表了一個 Excel 工具,用於避免發生基因名稱的轉換錯誤,作者提供了線上版本、Windows Excel Add-In、Mac 拖放工具、Perl script、簡單的 web server 等工具,發佈在 Github 上提供大家使用 (https://github.com/pstew/escape_excel)
Windows 作業系統 Excel Add-In 安裝很方便,下載 release/2017-06-28/EscapeExcelAddin/setupEscapeExcel.exe 執行安裝即可使用此工具開啟檔案。
Mac 作業系統一樣方便使用,下載後可執行工具即可拖拉檔案完成正確轉換。
當然除了基因名稱,在數字表示、科學記號、特殊字元組合也可能被 excel 誤判而錯誤轉換,因此研究時需隨時注意細節、保持謹慎態度、多檢視多驗證才不會導致研究結果因這類錯誤而大打折扣。
參考文獻:
[1] Welsh, E. A., Stewart, P. A., Kuenzi, B. M., & Eschrich, J. A. (2017). Escape Excel: A tool for preventing gene symbol and accession conversion errors. PLoS ONE, 12(9), e0185207–10. [2] http://blogs.nature.com/naturejobs/2017/02/27/escape-gene-name-mangling-with-escape-excel/
[3] https://www.bbc.com/news/technology-37176926
圖爾思生物科技 / 微生物體研究中心
郭育倫 文案