alexa
置頂

對比個體兼基因差異,找出致病基因

文 / 謝宏媛    
2000-07-01
瀏覽數 15,800+
對比個體兼基因差異,找出致病基因
分享 Line分享分享 複製連結

我常說,很羨慕現在才要畢業的人(指生命科學相關系所的學生),前面的遠景可說是無窮的,接下來會發生什麼事沒有人知道。為什麼這樣講呢?human genome project(人類基因體計畫)是主要原因。

這個項目在美國近代史來講,是由國家推動的第三個大科研項目,對比於一九四○年代的曼哈頓計畫,造成原子彈的發明;六○年代的登月「阿波羅」計畫,帶動後來的電子、電腦工業。

八○年代中期就在談要把人類三十億個鹼基對全部定序,經過四、五年爭議,一九九○年才正式開始。當初在討論這項計畫時,我也曾參與,當時估計,每一個base pair(鹼基對)大約要花十美元,人有三十億對,所以要三百億美元,這是想都不敢想的事。

降低測序費用,基因體計畫上路

爭吵半天最後決定,第一件要改進的事,就是測序的技術,把十美元的成本降到一美元,這樣只要三十億美元就做得成。也因為這樣,一九九○年開始的策略是要花十五年的光陰、花三十億美元,到二○○五年完成。

九八年人類基因體的定序有重大變化,是因為商業界終於加入競爭。因為他們的加入,所以本來預計二○○五年才做完的計畫頓時突飛猛進。

NIH(美國國家衛生研究院)主導的計畫本來提早兩年,到二○○三年,後來又加快到二○○一年。現在今年可能就能把大部分的genome(基因體)序列測定來,雖然做出來的並不是完整的序列,不過就功能分析來講已經達到效果。

產業界到底憑什麼力量能讓政府主導的計畫發生變革?主要是Celera這家公司。

兩年前五月,Celera成立,真正設廠、招人手、開始生產數據,是一九九九年,也就是離現在不過一年前。這家公司只用了三個月就把果蠅的基因體序列測定出來,然後再花三個月做資料整合,其結果今年三月已經發表了。

一九九九年前半年還有很多人懷疑 ,認為Celera不可能做得這麼快,結果Celera在三月發表果蠅序列以後,再也沒有人有疑問。果蠅基因體的大小,跟一個染色體幾乎一樣,所以如果用這個方法可以組合出果蠅,組合人體二十三對染色體應該不是問題。

測序競速,Celera與世界抗衡

Celera到底憑什麼做到?

它是全世界最大的測序工廠,一共有三百架ABI3700測序儀器。測序速度在最近兩年加快的最大原因,就是這部使用毛細管電泳的儀器。以前做序列要做膠,辛辛苦苦的把樣本(sample)放在膠上面,現在統統省下來,機器可以做這些事。Celera的三百架機器只有五十個人在運作,以最快的速度,一個人一天可以產出一萬個樣本,在從前這要花一年時間。

因為這樣,Celera每天要用的電量非常高,高到美國東部當地的電力公司特別為Celera做了一架電力輸送塔。

這麼多數據不可能用人處理,所以電腦在這個階段發揮重大功能。Celera另一特色是有超級電腦設備。它們跟Compaq( 康柏)合作,由Compaq提供一千兩百架最新型的 processor,一台 processor每小時可以運算兩千五百億的序列比對工作。每一架都是一台超級電腦,這套電腦當時估價是七千萬美元,被稱為是民用電腦裡功能最強者,全世界比它功能更強的 ,只有美國五角大廈裡用來做軍事運算的電腦。

Celera一家的測序能力幾乎等於是the rest of the world(也就是由公家放款的各測序中心 ) ,所以兩者發生相當的衝突,一方面競爭,一方面互相批評。

不過Celera目的是用超高速的產能來生產資料,再用超級電腦把資料整合起來,分析後產生的數據當成商品來賣。也就是說,從前學術界在傳遞知識的時候效能比較低,而商業化的好處正是效率提高。

而且從前以提供資訊維生的公司,靠的都是政府或公家機構產生的數據,現在一家私人公司有產生數據的能力,對生化產業的生態產生相當大的衝擊。

Celera產生database(資料庫)。人類的眼睛看DNA(去氧核醣核酸),只是一大堆ATCG(鹼基),沒什麼意義,也就是DNA的密碼不是我們的眼睛、嘴巴所能瞭解的,這樣的語言必須加以整合分析。一般來說是用比較的方式(人與人之間的基因,人與其他物種的基因),主要應用在醫學和農業,因為醫學方面的附加價值最高,所以目前應用上以醫學為首要。

在藥物上的應用,是以人和mouse(小老鼠)對比做為基礎(研究指出,在文獻上有記載的兩百八十九個人類致病基因裡,九○%在小老鼠身上找得到),植物上則是水稻和雲南芥菜。介於兩者之間的就是果蠅。

這幾樣的基因體序列在一、兩年前看起來,都要等五到十年才做得出來,突然幾乎全部都可以出來。從基因體定序和生物資訊學來看,這是一個知識大爆炸的時代。對想從基因上做研發的人,可以說已經沒有時間再等了。

到底各種基因體做出來,會有什麼樣的影響?

從前是一個人窮畢生之力,研究單一基因。現在因為所有十萬個基因一下全部都出來,所以研究方式必須加以改變,改變最根本需要從觀念上來著手。我們可以用各種生物的基因體比對,來看看資料的狀況會是怎樣。

例如,從進化上一步步增加來看,果蠅的基因數只有一萬三千個,比線蟲(C.elegaus)的一萬八千個基因來得少,令所有人大跌眼鏡,非常驚訝。果蠅比線蟲進化得多,但基因的數量不見得愈來愈多。

進一步來想(但這個結論到現在還有爭議),果蠅是天上飛的,有眼睛的,現在有些眼睛方面的疾病已經在人、老鼠、果蠅身上找到相關基因,也就是說,尋找這些疾病本源的時候,可以用果蠅當樣品。可是大腸桿菌沒有眼睛,所以並沒有這樣的疾病基因。在進化上果蠅更接近人,但基因數量卻比線蟲更少。現在有相當多的人,在這些知識方面做進一步的分析。

有這麼多不同的生物基因體,往後研究一個基因,不再只看它在某特定種族上發生什麼功用,要看這個基因在好幾個不同生物體上扮演什麼角色。所以就產生一個新的學科,叫gene ontology,中文可以叫做「對比基因學」。

Gene ontology是一個基本架構,將來我們在做學術研討,或在教科書上寫一個基因的時候,不能僅說我這個基因在人體做什麼功用。一個基因在不同生物體上,可能扮演不同角色,雖然基本功能也許類似。所以表達這些基因,必須把它在各個不同的族類的位置和功能都要講出來。也就是說,這是件非常複雜的事,不再只用兩度空間就能表達得很清楚,需要發展新的工具,展現類似基因究竟在不同的生物體上扮演什麼角色。

利用SNPs,找出致病基因

人類到底最關心的還是自己。以美國發生的例子來說,通常申請專利或智財權保護,最重要的還是人。例如在果蠅或小老鼠身上找到一些基因申請專利,將來如果有人利用對比的方式找到人的類似基因,他也可以申請專利,因為將來的醫藥是要用來治療人的,並不是要治療果蠅或老鼠。

用來對付果蠅或老鼠的專利,雖然具有研究上的價值,但可能沒有經濟價值。所以若從經濟的層次看,尋找人類基因還是最重要的一環。

回頭談談人類基因體。常有人問,第一個基因體做出來,到底是誰的?

早年我們做基因體計畫要籌款的時候,有人提議找有錢人,如三十億美元對B.Gates(蓋茲)來說可能不是很多,等定序完成以後,就把這個基因體叫做「Gates Genome」。後來因為考慮種種原因(例如個人隱私,如果Gates有某種毛病,後世千萬年都知道)而作罷。

所以,第一個做出來的基因是很多人拚拚湊湊出來的。每個人的基因體跟這個基因體,都會有些異同。

當然全世界六十億人口,不可能把基因體拿來統統再做一遍,總要想出好方法來比較人跟人之間的差異。現在想出來最好的方法就是SNPs(單一核E酸多C性,Single Nucleotide Polymorphism)。

我們知道人跟人之間的變異大約是千分之一,嚴格說來是每一千個鹼基中會有一到三個不同。數量這麼多,而且分布在整個基因體裡,若是每一個都要找出來,工作量也是不可想像。

經過一番電腦推算,有人提議,假設每一萬個鹼基對找出一個點來當標竿,就只要三十萬個點。這些點必須是變異性最大的(定義是要超過二○%),也就是一百個人至少要有二十個以上,在那個點會出現變異。也就是說比較人跟人的基因,不用比較三十億,只要比較三十萬個點就可以。

如果可以在每一萬個點找一個SNPs,現在的基因晶片已經可以同時檢測三十萬個點,這樣做起來很快,可能一天就可以做好。

舉例而言,一千個病人都有某種疾病,再找幾千個沒有這些毛病的人,比較他們這三十萬個位點的差異,就可以歸納出到底有哪些差別,再從那些位點找出一些區間,這樣可以很快的找出蛛絲馬跡。

如果每個人都有三十萬個點,有一千個人 ,數量也相當龐大,需要大的電腦來運算,剩下的純粹是統計學的問題。

利用SNPs,除了找出致病基因,也會跟用藥的有效性有關。

在西方,某些藥的有效性是九○%,拿到東方來用,卻只有不到四○%的病人有效,因為這些藥的臨床試驗都是以西方人來做的。此外,不管東西方人,給藥以後 ,有少部分人不但無效,可能還會受害。而醫生在使用藥之前,並不曉得病人是否為會受害的那一組。

在做clinical trial(臨床試驗)的時候,如果能把SNPs的資料估算進去,用藥之前只需要簡單的基因測試,就可以知道病人屬於哪一種體質,也就是可以依此發展出個體醫療。下一個世紀會是分子醫療的世紀,把個體差異都定義出來,用藥就會有個體性。

不過可惜的是,現在蒐集的SNPs很少,只有五百個基因左右,基因資料庫上面雖已經蒐集了十萬個SNPs,卻不曉得位點在哪裡。

基因研究由零售變成批發

我們可以做成這樣的結論,超過九五%的人類基因體在今年之內可以做得出來,事實上現在已經在了,卻只是在等電腦處理。因為這樣,大部分基因的位置馬上可以被鑑定出來。

在人類基因體中,大部分的基因是生物學上從來沒有見過的,也就是說,要尋找它的功能不是那麼容易。

而文獻上記載,有六千種疾病可能是因為基因變異所產生,但其中只有三至四百個基因被發現。也就是,有上千個可能跟疾病相關的基因還沒被定義,從醫學上來說這是很有價值的,發展出新藥當然代表的是財富,所以很多公司都在擠這個位置。如果有人能找出基因的功能、申請專利,經濟效益是無可估計的,這是生技最近突然走紅的主因。

進一步說,多重基因引起的疾病(例如糖尿病),從前束手無策,當基因統統已知,就會有新的方法來找。

這些發展提供大家參考,從前我們研究genetic(遺傳體)只能說是「零售」,是由一個一個基因來看,現在則是「批發」了,從整體來看。研究這些當然要開發新工具,這些都已經是兵家必爭之地。

科學家要努力尋找疾病與基因的關聯

歷經十載、超過兩億五千萬美元的投資,今年是「基因體計畫」(排定人體全部DNA序列)的豐收年。

五月中旬,英國《自然科學雜誌》刊載國際科學研究小組完成了第二十一號染色體的排序。現在美國知名的生技公司Celera Genomics也已經完成人類二十三對染色體的全部序列初稿,最快半年後就要公布這些資訊,目前有六、七家大藥廠每年花五、六百萬美元訂閱其資料庫。由美國國家主導的人類基因體計畫,則可望於今年第三季完成初稿。(該計畫在十年前開始,定序方式和Celera不同,得出的資料持續在網路上公開給全世界使用)

一九九八年才成立的Celera,用最新的定序儀器和運算能力超強的電腦,以很短的時間完成人類基因圖譜的草稿,加上Celera的總裁C. Venter擅於在媒體造勢,導致該公司股價如脫韁野馬。

不過,由於政府資助的基因體計畫,不斷地在網路上公布定序成果,所以很多公司早在四、五年前就開始用基因來尋找新藥了。就像《亞洲華爾街日報》五月三十日的報導,很多研究者認為Venter過份渲染了基因體草圖的完成。

在美國,和Venter一樣受媒體重視的W. Haseltine(Human Genome Sciences Inc.的主席兼總經理),傾向把草稿的完成視為心理的里程碑,而非科學的重大突破,因為以基因為基礎的醫學研發早就如火如荼地進行,治療氣喘、老化、癌症的新藥或新療法,很多也在臨床實驗的階段。

《亞洲華爾街日報》也報導了另一家重要生技公司Immunex Corp.的看法。該公司的技術總監(CTO)D. Williams認為,定序基因體「的確是重要的里程碑,卻也是這場馬拉松賽的前一英哩。」他說,現在幾乎每一家生技公司裡,都有專家在電腦資料庫裡蒐尋有用的基因資訊。

不管Celera是否為了股價而發布一些消息,無庸置疑的是,未來,人類基因體將是生物學研究的基礎。

基因解開人類生理之謎

既然已經鳴鎗起跑,那麼未來生物科技將因基因資訊的公開而跑向何方?跟我們又有什麼關係?

美國《新聞周刊》對這個問題也感到好奇,因此在四月中旬以封面故事大幅報導基因體定序對醫藥科學和產業界的影響。該周刊指出,就像一九七七年蘋果電腦公開第一台家用電腦時,沒人能預見eBAY或亞馬遜公司,現在也沒有任何水晶球能預告,得到人類基因體的資訊,將對我們的生活產生什麼影響?甚至如何幫助我們瞭解自己?

不過,美國《新聞周刊》認為下列幾個方向極可能成真:

一、醫師滴幾滴基因在生物晶片上,找出是否有前列腺癌,會不會致命;或藉此找出某人所罹患的白血病對哪些藥的反應比較好。醫師也可以分析孩子的基因,判斷死於心臟病或阿茲海默症的機率。

二、科學家可以找出,當傷口癒合、嬰兒長出指頭、頭皮變禿、長出皺紋、人在學唱一首歌或記下一些東西、荷爾蒙大量分泌,或是我們被壓力所困擾時,是哪些基因被打開了?他們也會進一步找出如何操作這些基因。

三、母親在懷孕前就先把嬰兒的基因設計好,雇主在雇人前,先看一下員工的基因資料,如果他們對某部分的DNA不滿意,就不雇用。

從研究者的角度來看,基因體計畫完成,讓研究的質與量都提高。

做基因定序超過二十年,目前任職於Celera的主任科學家(Principal Scientist & Director)陳奕雄說明,科學界過去要窮數十年之力研究單一的基因,現在人類基因體(人體基因的全部總合)公開,資訊爆炸,「基因研究,以前是零售,現在是批發,」陳奕雄比喻。

未來產、學界的研究方法將大不相同,研究的速度也大幅加快。舉例而言,因為資訊完整,科學界可以用比對的方式,找出某種遺傳疾病病人的基因和正常人基因的差別,再進一步分析,找到診斷疾病或治療疾病的方法。但是,急著要看到基因研究成果,或馬上想藉此治療遺傳疾病的人,可能要失望了。

根據《亞洲華爾街日報》的調查,從基因研究找出的藥物,目前幾乎都在實驗室或臨床試驗的階段。產業界的研究人員預測,第一波來自基因研究的藥物,大約會在五年後上市。

許多治療方法可能需時更久,因為在此之前,必須先瞭解基因如何致病,而這需要時間。儘管找到關鍵基因,也不代表有效的藥物或治療方法就會因應而生。

陽明大學遺傳研究所教授周成功就明白地說,科學家目前還找不到完美的方法,來判斷基因代表的遺傳訊息,和人的體質(疾病發生的可能性)之間的關聯。

方法雖不完美,但以美國為龍頭的生技產業和學術研究,時時傳出驚喜。就像原本預計在二○○五年才能完成的基因體計畫,提早五年交出第一張成績單一樣,找出基因和疾病的關聯而採取行動,或許不會有我們想像的那麼久。(謝宏媛)

本文出自 2000 / 07 月號

第169期遠見雜誌

分享 Line分享分享 複製連結
您可能會喜歡