蛋白質粵拼daan6*2 baak6 zat1),有機化合物一類,分子複雜,由氨基酸分子脫水縮合而成,又寫做[1](粵拼:gun² / jyun²)。

肌球蛋白結構圖

蛋白質係由氨基酸分子串成一串咁排列形成,而氨基酸排嘅次序係按基因而定。除咗遺傳密碼所編碼嘅廿種標準氨基酸之外,響蛋白質度,某啲氨基酸殘基重可以經翻譯後修飾,而造成化學結構變化,從而啟動或調控蛋白質。幾個蛋白質黐埋一齊嘅時候,會形成穩定嘅蛋白質複合物,發揮某一特定功能。

蛋白質係所有生物必要嘅組成成分,幾乎細胞所有活動佢都有份。例如,係最常見嘅蛋白質,專門催化生物化學反應,從而促進生物體嘅代謝。又例如肌肉中嘅肌動蛋白肌球蛋白,以及細胞骨架中嘅微管蛋白等等。

因此,蛋白質係人類不可或缺嘅成分。之不過,人類要靠食嘢來吸收蛋白質,咁係因為動物自己冇能力合成晒所有必需氨基酸

蛋白質呢個概念,最早係由瑞典化學家白則里1838年提出,但當時嘅認識只係好皮毛。1926年詹姆斯•B•薩姆納揭示尿素酶係蛋白質,第一次證明咗酶係蛋白質[2]

歷史同詞源

編輯

發現同早期研究

編輯

蛋白質自1700年代就畀Antoine Fourcroy等人研究同認識,[3][4],佢哋通常一齊叫佢哋做「albumin」,或者叫做「albuminous materials」(德文:Eiweisskörper)。[4]

例如,Gluten最初喺1747年左右嘅發表研究中由小麥分離出嚟,之後發現佢喺好多植物入面都有。[3]

喺1789年,Antoine Fourcroy認識咗三種唔同嘅動物蛋白:albuminfibringelatin[5]

喺1700年代尾同1800年代初研究嘅植物蛋白,包括gluten植物albumingliadinlegumin.[3]

蛋白質首次由荷蘭化學家Gerardus Johannes Mulder描述,並喺1838年由瑞典化學家Jöns Jacob Berzelius命名。[6][7]

Mulder進行咗常見蛋白嘅elemental analysis,發現幾乎所有蛋白都有相同嘅empirical formula,即係C400H620N100O120P1S1[8] 佢錯誤咁認為,呢啲蛋白可能係由單一種類(好大嘅)分子組成。

用嚟形容呢啲分子嘅「protein」呢個字係Mulder嘅夥伴Berzelius提議嘅;「protein」嚟自希臘πρώτειοςproteios),意即「主要嘅」[9],即係「領先」或者「站喺前面」[4],加埋-in

Mulder之後又識別咗蛋白質降解嘅產物,例如amino acidleucine,佢測出個分子量(幾乎正確)係131 Da[8]

早期嘅營養科學家,例如德國嘅Carl von Voit,認為蛋白質係維持身體結構最重要嘅營養,因為普遍相信「肉生肉」。[10]

大約喺1862年,Karl Heinrich Ritthausen分離出咗氨基酸glutamic acid[11]

Thomas Burr Osborne整咗一篇好詳細嘅植物蛋白綜述,喺Connecticut Agricultural Experiment Station進行。Osborne同Lafayette Mendel一齊,喺實驗鼠嘅飼養實驗入面確定咗幾種必需氨基酸[12]

缺乏必需氨基酸嘅飲食會令實驗鼠生長受阻,符合Liebig's law of the minimum嘅原理。[13]

最後一個被發現嘅必需氨基酸threonine,係由William Cumming Rose識別嘅。[14]

早期蛋白質生化學家因為純化蛋白嘅困難而受阻。雖然可以大量從血液、蛋白同keratin攞到蛋白質,但單一嘅蛋白係攞唔到嘅。喺1950年代,Armour Hot Dog Company純化咗1公斤牛胰ribonuclease A,並免費提供畀科學家。呢個舉動令到ribonuclease A成為之後幾十年生化研究嘅主要對象。[8]

多肽

編輯
 
多肽

將蛋白質理解成polypeptide,即係氨基酸鏈,係由Franz HofmeisterHermann Emil Fischer喺1902年嘅研究中獲得嘅。[15][16]

活體生物內蛋白質作為enzyme催化反應嘅核心角色,直到1926年先先完全得到認識,當時James B. Sumner證明咗酶urease其實就係一種蛋白質。[17]

Linus Pauling成功預測咗蛋白質有規律嘅secondary structure,基於hydrogen bonding嘅原理,而呢個概念最早係由William Astbury喺1933年提出。[18]

隨後Walter Kauzmann變性嘅研究,[19][20]部分基於Kaj Linderstrøm-Lang之前嘅研究,[21]有助於理解由疏水性相互作用介導嘅protein folding同結構。[22]

第一個完成氨基酸鏈測序嘅蛋白係insulin,由Frederick Sanger喺1949年完成。Sanger正確確定咗insulin嘅氨基酸序列,從而明確證明蛋白質係由直線嘅氨基酸聚合物組成,而唔係分枝鏈、colloids或者cyclols[23] 佢因呢項成就喺1958年攞咗諾貝爾獎。[24]

Christian Anfinsen對ribonuclease A嘅oxidative folding過程嘅研究,令佢喺1972年攞咗諾貝爾獎,同時鞏固咗蛋白質摺疊嘅thermodynamic hypothesis,根據呢個理論,蛋白質嘅摺疊形式就係其自由能最低狀態。[25][26]

結構

編輯
 
John Kendrew正喺進行肌紅蛋白模型製作

隨住X-ray crystallography嘅發展,科學家開始可以測定蛋白質嘅結構同埋序列。[27]

1958年,第一批被解出嘅protein structure係由Max PerutzhemoglobinmyoglobinJohn Kendrew解出嘅。[28][29]

電腦嘅運用同不斷提升嘅計算能力,幫助咗解讀複雜蛋白嘅序列。1999年,Roger Kornberg利用synchrotrons出嘅高強度X射線,測序咗結構極為複雜嘅RNA polymerase[27]

此後,已經發展出用於大型巨分子組合體cryo-electron microscopy(冷凍電子顯微鏡技術)[30]。Cryo-EM採用冷凍嘅蛋白質樣本,而唔係晶體,同埋用電子束取代X射線,減少對樣本嘅損害,令科學家可以攞到更多資訊並分析更大嘅結構。[27]

運用計算方法進行小型蛋白structural domainprotein structure prediction,幫助研究人員接近原子層級嘅蛋白質結構解析。[31]

截至April 2024年 (April 2024-唔見咗必要嘅參數 1=月份)Protein Data Bank內收錄咗181,018個X射線、19,809個EM同12,697個NMR嘅蛋白質結構。[32]

分類

編輯

蛋白質主要根據序列結構嚟分類,雖然其他分類方式都好常見。特別係對於嚟講,酶委員會編號(EC編號)系統提供咗一套功能分類嘅方法。[33]

同樣,基因本體論會根據基因蛋白質生物學生化功能,以及佢哋嘅細胞內部位置嚟分類。[34]

根據序列相似性,蛋白質可以被分類成進化功能上嘅相似類別。呢個過程可以使用整個蛋白質,或者集中分析蛋白質結構域,尤其係喺多結構域蛋白質中。蛋白質結構域能夠將蛋白質根據序列結構功能分類,並且可以多種方式組合。

喺一項對170,000個蛋白質嘅早期研究中,大約有三分之二嘅蛋白質至少被分配咗一個結構域,而較大嘅蛋白質通常包含更多結構域(例如,大於600個氨基酸嘅蛋白質平均包含超過5個結構域)。[35]

生物化學

編輯
 
肽鍵嘅化學結構(下方)同丙氨酸與相鄰氨基酸之間肽鍵嘅三維結構(上方/插圖)。肽鍵由CHON元素組成。
 
共振結構顯示咗連接氨基酸形成蛋白質聚合物肽鍵
内文:[[:生物化學]]、[[:氨基酸]]同[[:肽鍵]]

大多數蛋白質係由20種L-α氨基酸組成嘅線性聚合物。所有蛋白原氨基酸都有一個共同結構,其中α-碳原子連接咗一個氨基、一個羧基,以及一個變化多端嘅側鏈。只有脯氨酸係個例外,因為佢嘅側鏈呈環狀,仲同氨基連接埋,令蛋白質鏈嘅靈活性有限。[36]

標準氨基酸列表嘅側鏈具有多樣嘅化學結構同特性,氨基酸嘅總體效果決定咗蛋白質三維結構同化學反應性。[37]

多肽鏈入面,氨基酸係通過肽鍵連接,呢啲鍵連接氨基同羧基。一條鏈入面嘅每個氨基酸叫做「殘基」,而連接碳、氮同氧原子嘅序列稱為「主鏈」或「蛋白質骨架」。[38]:19

肽鍵有兩種共振形式,呢啲共振令肽鍵有一定嘅雙鍵特性。α-碳原子、氮同羰基(C=O)通常都係共面嘅,而肽鍵嘅另外兩個二面角會決定蛋白質骨架嘅局部形狀。由於N-C(O)嘅雙鍵特性,蛋白質有一定嘅剛性。[38]:31

多肽鏈嘅一端係有自由氨基嘅,稱為「N-末端」或「氨基末端」,而另一端係有自由羧基嘅,稱為「C-末端」或「羧基末端」。[39]

按慣例,肽鏈嘅序列係由N-末端到C-末端書寫,呢種次序同核糖體合成蛋白質嘅次序相符。[39][40]

蛋白質」、「多肽」同「」呢幾個詞有少少含糊,有時仲會重疊。「蛋白質」通常指處於穩定三級結構嘅完整生物分子,而「肽」通常係指較短嘅氨基酸寡聚體,佢哋通常冇穩定嘅三維結構。但係,兩者之間嘅界限冇嚴格定義,一般係20–30個殘基左右。[41]

蛋白質可以同好多種類嘅分子同離子互動,包括其他蛋白質脂質碳水化合物DNA[42][43][44]

細胞內嘅豐富度

編輯

喺一個典型嘅細菌細胞(例如大腸桿菌金黃色葡萄球菌)入面,大概含有2百萬個蛋白質。而較細嘅細菌,例如黴漿菌螺旋體,大約有5萬到1百萬個分子。相對而言,真核生物細胞較大,所以含有嘅蛋白質量更多。例如,釀酒酵母細胞估計含有大約5千萬個蛋白質,而人類細胞大約有10億至30億個蛋白質。[45]

單個蛋白質拷貝嘅濃度範圍由每細胞幾個分子到2千萬個唔等。[46]

唔係所有編碼蛋白質嘅基因都喺大多數細胞中表達,具體數量仲取決於細胞類型同外部刺激。例如,喺人類基因組中大約2萬個編碼蛋白質嘅基因,只有6千個會喺淋巴母細胞中被檢測到。[47]

喺大自然中,認為最豐富嘅蛋白質係RuBisCO,一種喺光合作用中催化二氧化碳同有機物結合嘅。植物中呢種酶嘅重量可以佔到1%。[48]

合成

編輯

生物合成

編輯
 
一個核糖體用mRNA作模板合成蛋白質
 
一個基因嘅DNA序列編碼蛋白質嘅氨基酸序列
内文:[[:蛋白質生物合成]]

蛋白質係根據基因所編碼嘅資訊,由氨基酸組合而成。每個蛋白質都有自己獨特嘅氨基酸序列,而呢個序列係由編碼該蛋白嘅基因嘅核苷酸序列所決定嘅。基因密碼係一組由三個核苷酸構成嘅單位,叫做密碼子,每一組三核苷酸組合代表一個氨基酸,例如AUG(腺嘌呤尿嘧啶鳥嘌呤)就係甲硫氨酸嘅密碼。因為DNA含有四種核苷酸,所以可能嘅密碼子總數係64個;因此,基因密碼存在某啲冗餘,即係某啲氨基酸會由多個密碼子指定。[44]:1002–42

DNA中編碼嘅基因首先會由例如RNA聚合酶等蛋白質轉錄成前體信使RNA(mRNA)。大部分生物再利用各種轉錄後修飾方式處理呢個前體mRNA(即「初級轉錄物」),形成成熟嘅mRNA,然後由核糖體以之作模板合成蛋白質。喺原核生物入面,mRNA可以係產生後即刻使用,或者等佢離開核區之後再被核糖體結合;相反,真核生物係喺細胞核內產生mRNA,然後通過核膜轉運到細胞質,喺嗰度進行蛋白質合成。原核生物嘅蛋白質合成速度比真核生物快,可以達到每秒合成20個氨基酸。[49]

由mRNA模板合成蛋白質嘅過程叫做轉譯。mRNA會被裝載上核糖體,每次讀取三個核苷酸,將每個密碼子同位於轉運RNA分子上嘅反密碼子進行鹼基配對,而呢個轉運RNA攜帶著與所識別嘅密碼子相對應嘅氨基酸。酶氨基酸tRNA合成酶會將正確嘅氨基酸「充電」俾tRNA分子。增長嘅多肽通常被稱作「新生鏈」。蛋白質合成嘅方向始終係由N-末端C-末端[44]:1002–42

合成出嚟嘅蛋白質嘅大小可以根據佢所包含嘅氨基酸數量同總分子質量嚟衡量,通常以「道爾頓」(同原子質量單位同義)或者千道爾頓(kDa)作單位報告。由於高等生物嘅蛋白質包含更多嘅蛋白質結構域,蛋白質嘅平均大小係由古菌細菌再到真核生物逐步增加(分別為283、311、438個殘基,同31、34、49 kDa)。[50] 例如,酵母蛋白平均長度為466個氨基酸,質量約53 kDa。[41] 已知最大嘅蛋白質係titin,係肌肉肌節嘅一部分,其分子質量接近3,000 kDa,同總長度近27,000個氨基酸。[51]

化學合成

編輯
内文:[[:肽合成]]
 
肽合成

短蛋白可以用一系列嘅肽合成方法進行化學合成。呢啲方法依賴有機合成技術,例如化學連接,以高產量製造肽。[52] 化學合成亦容許喺多肽鏈中引入非天然氨基酸,例如將螢光探針接駁到氨基酸側鏈上。[53] 呢啲方法喺實驗室生物化學細胞生物學中好有用,但通常唔適用於商業應用。對於超過大約300個氨基酸嘅多肽,化學合成效率較低,而且合成出嚟嘅蛋白質可能未必能夠輕易採取佢哋原生嘅三級結構。大部分化學合成方法係由C-末端N-末端進行,與生物合成反應方向相反。[54]

結構

編輯
 
分子伴侶嘅晶體結構,一個巨大嘅蛋白質複合體。一個蛋白亞基被突顯出嚟。分子伴侶有助於蛋白質摺疊。
 
Three possible representations of the three-dimensional structure of the protein 三磷酸異構酶. 左邊: 全原子模型,以原子種類著色。 中間: 簡化表示,展示主鏈構型,以次級結構著色。 右邊: 可溶劑表面表示,以殘基種類著色(酸性殘基紅色,鹼性殘基藍色,極性殘基綠色,非極性殘基白色)。
内文:[[:蛋白質結構]]
想知多啲:[[:蛋白質結構預測]]

大部分蛋白質都會摺疊成獨特嘅三維結構。蛋白質自然摺疊成嘅形狀稱為佢嘅天然構型[38]:36

雖然好多蛋白質可以靠住自身氨基酸嘅化學性質自發摺疊,但亦有啲蛋白需要分子分子伴侶分子伴侶)幫手先至摺疊到佢哋嘅天然狀態。[38]:37

生物化學家通常將蛋白質結構劃分為四個明顯層次:[38]:30–34

  • 原級結構: 即蛋白質嘅肽序列,蛋白質係一種聚酰胺
  • 次級結構: 由氫鍵穩定嘅規則重複局部結構,最常見嘅例子係α-螺旋β-摺板轉角。由於次級結構屬於局部結構,同一個蛋白分子入面可以有多個不同嘅次級結構區域。
  • 三級結構: 單一蛋白分子嘅整體形狀;即各個次級結構之間嘅空間關係。三級結構通常係由非局部相互作用穩定,包括最常見嘅疏水核心形成,亦有鹽橋、氫鍵、二硫鍵,甚至轉譯後修飾嘅影響。術語「三級結構」經常同「摺疊」互換使用,而三級結構控制住蛋白質嘅基本功能。
  • 四級結構: 由多條蛋白質分子(多肽鏈)組成嘅結構,呢啲分子喺呢個情境下通常稱為「蛋白亞基」,佢哋作為一個單一嘅蛋白質複合體運作。
  • 蛋白質五級結構: 蛋白質表面嘅特徵,用以組織擁擠嘅細胞內部。五級結構取決於細胞內發生嘅瞬時但又必不可少嘅巨分子相互作用。

蛋白質唔係完全僵硬嘅分子。除咗以上嘅結構層次外,蛋白質喺執行功能時可以喺幾個相關嘅構型之間轉換。喺呢啲功能性重排嘅背景下,呢啲三級或四級結構通常被稱為「化學構型」,而佢哋之間嘅轉變叫做「構型改變」。呢啲改變通常係由於底物分子結合到酶嘅活性位點(即參與化學催化嘅蛋白質區域)而誘導。喺溶液中,蛋白質結構會因熱振動同同其他分子碰撞而有所變化。[44]:368–75

 
幾種蛋白質嘅分子表面,顯示佢哋嘅相對大小。從左至右分別係:免疫球蛋白 G(IgG,一種抗體)、血紅蛋白胰島素(一種激素)、腺苷酸激酶(一種酶)同麩胺酸合成酶(一種酶)。

蛋白質可以非正式咁劃分為三大類,呢啲類別同典型嘅三級結構相關:

一種特殊嘅情況係蛋白質內部嘅氫鍵,佢哋因為受到水嘅攻擊保護不足而促進自身脫水,呢啲被稱為脫水子[55]

蛋白質結構域

編輯
内文:[[:蛋白質結構域]]

好多蛋白質都由幾個蛋白質結構域構成,即係蛋白質中能夠摺疊成獨立結構單位嘅片段。[56]:134

結構域通常都有特定功能,例如活性(例如激酶)或者充當結合模塊。[56]:155-156

 
蛋白質結構域與基序。蛋白質結構域(例如EVH1結構域)係蛋白質中摺疊成固定三維結構嘅功能單位;而基序通常係指冇穩定三維結構嘅短序列,但具有特定功能。好多基序都係作為其他蛋白質嘅結合位點(例如圖中紅色同綠色條,在Ena/Vasp同源蛋白背景下顯示)。[57]

序列基序

編輯

蛋白質中嘅短氨基酸序列經常作為其他蛋白質嘅識別位點。[58] 例如,SH3結構域通常會結合短嘅PxxP基序(即兩個脯氨酸(P)由兩個未指明嘅氨基酸(x)間隔,儘管周圍氨基酸可能決定確切嘅結合特異性)。好多呢類基序已經被收集到真核線性基序資源(ELM數據庫)中。[59]

  1. 上新華字典查詢——朊原著喺2009-10-26歸檔。喺2008-12-03搵到
  2. (英文)Sumner, JB (1926). "The Isolation and Crystallization of the Enzyme Urease. Preliminary Paper" (PDF). J Biol Chem (英文). 69: 435–441. 原著 (PDF)喺2007年9月29號歸檔. 喺2009年11月12號搵到.
  3. 3.0 3.1 3.2 Osborne TB (1909). "History". The Vegetable Proteins. pp. 1–6.
  4. 4.0 4.1 4.2 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做Reynolds2003嘅參照
  5. Tanford, Charles (2001). Nature's robots: a history of proteins. Internet Archive. Oxford ; Toronto: Oxford University Press. ISBN 978-0-19-850466-5.
  6. Mulder GJ (1838). "Sur la composition de quelques substances animales". Bulletin des Sciences Physiques et Naturelles en Néerlande: 104.
  7. Hartley H (August 1951). "Origin of the word 'protein'". Nature. 168 (4267): 244. Bibcode:1951Natur.168..244H. doi:10.1038/168244a0. PMID 14875059. S2CID 4271525.
  8. 8.0 8.1 8.2 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做Perrett2007嘅參照
  9. "Protein (n.)". Oxford English Dictionary. July 2023. doi:10.1093/OED/5657543824.
  10. 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做Bischoff1860嘅參照
  11. Osborne, Thomas B. (April 1913). "In Memoriam Heinrich Ritthausen". Biochemical Bulletin. Columbia University Biochemical Association. II (7): 338. 喺1 January 2016搵到., archived at the Biodiversity Heritage Library
  12. Simoni, Robert D.; Hill, Robert L.; Vaughan, Martha (2002-05-03). "Nutritional Biochemistry and the Amino Acid Composition of Proteins: the Early Years of Protein Chemistry. The Work of Thomas B. Osborne and Lafayette B. Mendel". Journal of Biological Chemistry. 277 (18): 14–15. doi:10.1016/S0021-9258(19)35800-4.
  13. Osborne, Thomas B.; Mendel, Lafayette B.; Ferry, Edna L.; Wakeman, Alfred J. (1916). "The Amino-Acid Minimum for Maintenance and Growth, as Exemplified by Further Experiments with Lysine and Tryptophane". Journal of Biological Chemistry. 25 (1): 1–12. doi:10.1016/S0021-9258(18)87509-3.
  14. Simoni, Robert D.; Hill, Robert L.; Vaughan, Martha (2002-09-13). "The Discovery of the Amino Acid Threonine: the Work of William C. Rose". Journal of Biological Chemistry. 277 (37): 56–58. doi:10.1016/S0021-9258(20)74369-3.
  15. "Hofmeister, Franz". encyclopedia.com. 原先內容歸檔喺5 April 2017. 喺4 April 2017搵到.
  16. Koshland DE, Haurowitz F. "Protein, section: Classification of protein". britannica.com. 原先內容歸檔喺4 April 2017. 喺4 April 2017搵到.
  17. 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做Sumner1926嘅參照
  18. 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做Pauling1951嘅參照
  19. 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做Kauzmann1956嘅參照
  20. 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做Kauzmann1959嘅參照
  21. 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做Kalman1955嘅參照
  22. Dill, Ken A. (1990). "Dominant forces in protein folding". Biochemistry. 29 (31): 7133–7155. doi:10.1021/bi00483a001. PMID 2207096.
  23. 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做Sanger1949嘅參照
  24. 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做Lecture 1958嘅參照
  25. Richards FM (1972). "The 1972 nobel prize for chemistry". Science. 178 (4060): 492–3. Bibcode:1972Sci...178..492R. doi:10.1126/science.178.4060.492. PMID 17754377.
  26. Marshall, G. R.; Feng, J. A.; Kuster, D. J. (2008). "Back to the future: Ribonuclease A". Biopolymers. 90 (3): 259–77. doi:10.1002/bip.20845. PMID 17868092.
  27. 27.0 27.1 27.2 Stoddart C (1 March 2022). "Structural biology: How proteins got their close-up". Knowable Magazine. doi:10.1146/knowable-022822-1.
  28. 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做Muirhead1963嘅參照
  29. 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做Kendrew1958嘅參照
  30. 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做Zhou2008嘅參照
  31. 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做Keskin2008嘅參照
  32. "Summary Statistics". RCSB PDB. 喺2024-04-20搵到.
  33. McDonald, Andrew G.; Tipton, Keith F. (2023). "Enzyme nomenclature and classification: the state of the art". The FEBS Journal. 290 (9): 2214–2231. doi:10.1111/febs.16274. ISSN 1742-464X. PMID 34773359.
  34. The Gene Ontology Consortium (January 2008). "The Gene Ontology project in 2008". Nucleic Acids Research. 36 (Database issue): D440–4. doi:10.1093/nar/gkm883. PMC 2238979. PMID 17984083.
  35. Ekman D, Björklund AK, Frey-Skött J, Elofsson A (April 2005). "Multi-domain proteins in the three kingdoms of life: orphan domains and other unassigned regions". Journal of Molecular Biology. 348 (1): 231–243. doi:10.1016/j.jmb.2005.02.007. PMID 15808866.
  36. 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做Nelson2005嘅參照
  37. 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做Gutteridge2005嘅參照
  38. 38.0 38.1 38.2 38.3 38.4 Murray RF, Harper HW, Granner DK, Mayes PA, Rodwell VW (2006). Harper's Illustrated Biochemistry. New York: Lange Medical Books/McGraw-Hill. ISBN 978-0-07-146197-9.
  39. 39.0 39.1 Reusch, William (5 May 2013). "Peptides & Proteins". Michigan State University Department of Chemistry.
  40. Stryer L (2002). Biochemistry (第Fifth版). W. H. Freeman and Company. p. 826. ISBN 0-7167-4684-0.
  41. 41.0 41.1 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做Lodish2004嘅參照
  42. Ardejani MS, Powers ET, Kelly JW (August 2017). "Using Cooperatively Folded Peptides To Measure Interaction Energies and Conformational Propensities". Accounts of Chemical Research. 50 (8): 1875–1882. doi:10.1021/acs.accounts.7b00195. PMC 5584629. PMID 28723063.
  43. Branden C, Tooze J (1999). Introduction to Protein Structure. New York: Garland Pub. ISBN 978-0-8153-2305-1.
  44. 44.0 44.1 44.2 44.3 44.4 Van Holde KE, Mathews CK (1996). Biochemistry. Menlo Park, California: Benjamin/Cummings. ISBN 978-0-8053-3931-4.
  45. Milo R (December 2013). "What is the total number of protein molecules per cell volume? A call to rethink some published values". BioEssays. 35 (12): 1050–1055. doi:10.1002/bies.201300066. PMC 3910158. PMID 24114984.
  46. Beck M, Schmidt A, Malmstroem J, Claassen M, Ori A, Szymborska A, Herzog F, Rinner O, Ellenberg J, Aebersold R (November 2011). "The quantitative proteome of a human cell line". Molecular Systems Biology. 7: 549. doi:10.1038/msb.2011.82. PMC 3261713. PMID 22068332.
  47. Wu L, Candille SI, Choi Y, Xie D, Jiang L, Li-Pook-Than J, Tang H, Snyder M (July 2013). "Variation and genetic control of protein abundance in humans". Nature. 499 (7456): 79–82. Bibcode:2013Natur.499...79W. doi:10.1038/nature12223. PMC 3789121. PMID 23676674.
  48. Ellis, R.John (1979). "The most abundant protein in the world". Trends in Biochemical Sciences. 4 (11): 241–244. doi:10.1016/0968-0004(79)90212-3.
  49. 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做Pain2000嘅參照
  50. Kozlowski LP (January 2017). "Proteome-pI: proteome isoelectric point database". Nucleic Acids Research. 45 (D1): D1112–D1116. doi:10.1093/nar/gkw978. PMC 5210655. PMID 27789699.
  51. 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做Fulton1991嘅參照
  52. 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做Bruckdorfer2004嘅參照
  53. 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做Schwarzer2005嘅參照
  54. 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做Kent2009嘅參照
  55. 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做Fernandez2003嘅參照
  56. 56.0 56.1 Garrett, R.; Grisham, Charles M. (2010). Biochemistry (第4版). Belmont, CA: Brooks/Cole, Cengage Learning. ISBN 978-0-495-10935-8.
  57. Drees, Frauke; Gertler, Frank B (2008-02-01). "Ena/VASP: proteins at the tip of the nervous system". Current Opinion in Neurobiology. Development. 18 (1): 53–59. doi:10.1016/j.conb.2008.05.007. PMC 2515615. PMID 18508258.
  58. Davey NE, Van Roey K, Weatheritt RJ, Toedt G, Uyar B, Altenberg B, Budd A, Diella F, Dinkel H, Gibson TJ (January 2012). "Attributes of short linear motifs". Molecular BioSystems. 8 (1): 268–281. doi:10.1039/c1mb05231d. PMID 21909575.
  59. Kumar, Manjeet; Gouw, Marc; Michael, Sushama; Sámano-Sánchez, Hugo; Pancsa, Rita; Glavina, Juliana; Diakogianni, Athina; Valverde, Jesús Alvarado; Bukirova, Dayana; Čalyševa, Jelena; Palopoli, Nicolas; Davey, Norman E.; Chemes, Lucía B.; Gibson, Toby J. (2020-01-08). "ELM-the eukaryotic linear motif resource in 2020". Nucleic Acids Research. 48 (D1): D296–D306. doi:10.1093/nar/gkz1030. PMC 7145657. PMID 31680160.