[合集]如何得到全长isoform的序列?

[复制链接]
查看11 | 回复0 | 2021-1-30 01:41:01 | 显示全部楼层 |阅读模式
───────────────────────────────────────
作者ThomasBee(Tom),信区:Bioinformatics
标题如何得到全长isoform的序列?
时间北大未名站(2004年06月18日18:01:13星期五),转信
───────────────────────────────────────
如果我现在知道一个EST,想知道它所在的mRNA的全长序列,应该怎么做?
多谢!
───────────────────────────────────────
作者Feynman(KaKa),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月18日18:02:50星期五),转信
───────────────────────────────────────
啥物种啊?
ThomasBee (Tom) 在 ta 的帖子中提到:如果我现在知道一个EST,想知道它所在的mRNA的全长序列,应该怎么做?多谢!
───────────────────────────────────────
作者invoker(junkDNA),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月18日18:39:30星期五),转信
───────────────────────────────────────
一个???
ThomasBee (Tom) 在 ta 的帖子中提到:如果我现在知道一个EST,想知道它所在的mRNA的全长序列,应该怎么做?多谢!
───────────────────────────────────────
作者lylover(白愁飞(cinderella)),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月18日21:23:23星期五),转信
───────────────────────────────────────
下refseq里面的mRNA文件,然后做TBLASTX。
如果是没有Refseq的物种,那么,做实验吧。
ThomasBee (Tom) 在 ta 的帖子中提到:如果我现在知道一个EST,想知道它所在的mRNA的全长序列,应该怎么做?
多谢!
───────────────────────────────────────
作者yix(Punk),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月19日05:55:29星期六),站内信件
───────────────────────────────────────
ifyouhaveanESTwithanovelspliceform,thebestwaytogetthefulllengthisoformistodofull-lenghtisoformassemblyfromsplicegraphs.alternativelyyoucanuseareferencemRNAsequence(likeaRefSeqsequence)asthetemplate,andconstructyourisoformbyswappingsplicepatternsinthereferencesequencewithwhatisobservedinyourESTsequence.Checkthefollowingpapers.Youmighthavetodocertainamountofprogrammingbyyourselftoimplementthesemethods.
KanZ,StatesD,GishW.SelectingforfunctionalalternativesplicesinESTs.GenomeRes.2002Dec;12(12):1837-45.
HeberS,AlekseyevM,SzeSH,TangH,PevznerPA.SplicinggraphsandESTassemblyproblem.Bioinformatics.2002;18Suppl1:S181
XingY,ReschA,LeeC.Themultiassemblyproblem:reconstructingmultipletranscriptisoformsfromESTfragmentmixtures.GenomeRes.2004Mar;14(3):426-41.
ThomasBee (Tom) 在 ta 的帖子中提到:如果我现在知道一个EST,想知道它所在的mRNA的全长序列,应该怎么做?多谢!
───────────────────────────────────────
作者ThomasBee(Tom),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月19日17:00:25星期六),转信
───────────────────────────────────────
Thanksalot!
yix (Punk) 在 ta 的帖子中提到:ifyouhaveanESTwithanovelspliceform,thebestwaytogetthefulllengthisoformistodofull-lenghtisoformassemblyfromsplicegraphs.alternativelyyoucanuseareferencemRNAsequence(likeaRefSeqsequence)asthetemplate,andconstructyourisoformbyswappingsplicepatternsinthereferencesequencewithwhatisobservedinyourESTsequence.Checkthefollowingpapers.Youmighthavetodocertainamountofprogrammingbyyourselftoimplementthesemethods.KanZ,StatesD,GishW.SelectingforfunctionalalternativesplicesinESTs.GenomeRes.2002Dec;12(12):1837-45............................
───────────────────────────────────────
作者ThomasBee(Tom),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月19日17:51:06星期六),转信
───────────────────────────────────────
Isthereanyexistingdatabase?
yix (Punk) 在 ta 的帖子中提到:ifyouhaveanESTwithanovelspliceform,thebestwaytogetthefulllengthisoformistodofull-lenghtisoformassemblyfromsplicegraphs.alternativelyyoucanuseareferencemRNAsequence(likeaRefSeqsequence)asthetemplate,andconstructyourisoformbyswappingsplicepatternsinthereferencesequencewithwhatisobservedinyourESTsequence.Checkthefollowingpapers.Youmighthavetodocertainamountofprogrammingbyyourselftoimplementthesemethods.KanZ,StatesD,GishW.SelectingforfunctionalalternativesplicesinESTs.GenomeRes.2002Dec;12(12):1837-45............................
───────────────────────────────────────
作者yix(Punk),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月19日17:53:00星期六),站内信件
───────────────────────────────────────
databaseforwhat?ThomasBee (Tom) 在 ta 的帖子中提到:Isthereanyexistingdatabase?
───────────────────────────────────────
作者ThomasBee(Tom),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月19日17:56:50星期六),转信
───────────────────────────────────────
forfull-lengthisoformswhichwereassembledfromESTs
yix (Punk) 在 ta 的帖子中提到:databaseforwhat?
───────────────────────────────────────
作者yix(Punk),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月20日13:02:51星期天),站内信件
───────────────────────────────────────
iamsurprised...ithinkyouknowwherearethesedatabasesThomasBee (Tom) 在 ta 的帖子中提到:forfull-lengthisoformswhichwereassembledfromESTs
───────────────────────────────────────
作者ThomasBee(Tom),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月20日15:47:51星期天),转信
───────────────────────────────────────
ASP?Butonlytranslatedproteinsequences.
yix (Punk) 在 ta 的帖子中提到:iamsurprised...ithinkyouknowwherearethesedatabases
───────────────────────────────────────
作者lylover(白愁飞(cinderella)),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月20日15:49:22星期天),转信
───────────────────────────────────────
ft啊,这个,你不能拿个refeseq比对回去吗?嗬嗬
ThomasBee (Tom) 在 ta 的帖子中提到:ASP?Butonlytranslatedproteinsequences.
yix (Punk) 在 ta 的帖子中提到:iamsurprised...ithinkyouknowwherearethesedatabases
───────────────────────────────────────
作者ThomasBee(Tom),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月20日15:51:05星期天),转信
───────────────────────────────────────
RefSeq里面的mRNAisoform恐怕很不全吧?
lylover (白愁飞(cinderella)) 在 ta 的帖子中提到:ft啊,这个,你不能拿个refeseq比对回去吗?嗬嗬ASP?Butonlytranslatedproteinsequences.
───────────────────────────────────────
作者Feynman(KaKa),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月20日15:59:09星期天),转信
───────────────────────────────────────
yix不是说了吗,要是寻找novelisoform,需要自己动手来搞的
ThomasBee (Tom) 在 ta 的帖子中提到:RefSeq里面的mRNAisoform恐怕很不全吧?
───────────────────────────────────────
作者lylover(白愁飞(cinderella)),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月20日18:43:23星期天),转信
───────────────────────────────────────
拿蛋白序列比对genomesequence,然后把比对出来的genome序列抽出来就行了。
或者比对EST库,然后自己拼接。这已经足够一个工作了,完整的。不过,是不是有人已经做过?
ThomasBee (Tom) 在 ta 的帖子中提到:RefSeq里面的mRNAisoform恐怕很不全吧?
lylover (白愁飞(cinderella)) 在 ta 的帖子中提到:ft啊,这个,你不能拿个refeseq比对回去吗?嗬嗬ASP?Butonlytranslatedproteinsequences.
───────────────────────────────────────
作者aroluna(踏雪寻芳踪),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月20日20:24:09星期天),转信
───────────────────────────────────────
有这样一种现象,我做的那个gene实际是有12个exons的在它的genomestructure上但是事实是实验得到的全长的isoform是不利用exon7的那么如果这样子去预测的话,我觉得很多gene是和我做的gene有类似情况的,那么bioinformaticsprediction就不准确了,对于一大堆gene的database可行,并且还有一个概率上的可信性吧对于单个gene,很不实际的说,我是这么觉得
yix (Punk) 在 ta 的帖子中提到:ifyouhaveanESTwithanovelspliceform,thebestwaytogetthefulllengthisoformistodofull-lenghtisoformassemblyfromsplicegraphs.alternativelyyoucanuseareferencemRNAsequence(likeaRefSeqsequence)asthetemplate,andconstructyourisoformbyswappingsplicepatternsinthereferencesequencewithwhatisobservedinyourESTsequence.Checkthefollowingpapers.Youmighthavetodocertainamountofprogrammingbyyourselftoimplementthesemethods.KanZ,StatesD,GishW.SelectingforfunctionalalternativesplicesinESTs.GenomeRes.2002Dec;12(12):1837-45............................
───────────────────────────────────────
作者aroluna(踏雪寻芳踪),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月20日20:33:23星期天),转信
───────────────────────────────────────
这个方法可行?也许你比对后拼接的fullisoform根本就不存在呢?或者在某些情况下,有exon交换利用情况,怎么办?
lylover (白愁飞(cinderella)) 在 ta 的帖子中提到:拿蛋白序列比对genomesequence,然后把比对出来的genome序列抽出来就行了。或者比对EST库,然后自己拼接。这已经足够一个工作了,完整的。不过,是不是有人已经做过?RefSeq里面的mRNAisoform恐怕很不全吧?
───────────────────────────────────────
作者Feynman(KaKa),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月20日20:36:21星期天),转信
───────────────────────────────────────
呵呵,lylover最怕这样的问题了...不过bioinfor更多是用来找规律的,而不是用来解决特例的,我这么认为
aroluna (踏雪寻芳踪) 在 ta 的帖子中提到:这个方法可行?也你比对后拼接的fullisoform根本就不存在呢?或者在某些情况下,有exon交换利用情况,怎么办?
───────────────────────────────────────
作者aroluna(踏雪寻芳踪),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月20日20:36:56星期天),转信
───────────────────────────────────────
^_^,我是做实验的嘛:)
Feynman (KaKa) 在 ta 的帖子中提到:呵呵,lylover最怕这样的问题了...不过bioinfor更多是用来找规律的,而不是原来解决特例的,我这么认为
───────────────────────────────────────
作者kingsyl(Healthyisfirst.),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月20日20:40:03星期天),转信
───────────────────────────────────────
做实验的提问往往是最直接的.前几天我就和一个做实验的合作过,为了解决她提的问题(预测一个相互作用位点),我努力寻找,计算,再寻找,...最后还是没有解决.最后给了一个大致的结果,希望能有好运.:)
aroluna (踏雪寻芳踪) 在 ta 的帖子中提到:^_^,我是做实验的嘛:)
Feynman (KaKa) 在 ta 的帖子中提到:呵呵,lylover最怕这样的问题了...不过bioinfor更多是用来找规律的,而不是原来解决特例的,我这么认为
───────────────────────────────────────
作者Feynman(KaKa),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月20日20:43:35星期天),转信
───────────────────────────────────────
PNAS上见到好几篇这样的paper了,呵呵,祝好运!
kingsyl (Healthyisfirst.) 在 ta 的帖子中提到:做实验的提问往往是最直接的.前几天我就和一个做实验的合作过,为了解决她提的问题(预测一个相互作用位点),我努力寻找,计算,再寻找,...最后还是没有解决.最后给了一个大致的结果,希望能有好运.:)^_^,我是做实验的嘛:)
───────────────────────────────────────
作者lylover(白愁飞(cinderella)),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月20日21:16:46星期天),转信
───────────────────────────────────────
确实。bioinfo无法解释很多特例的,做模型必须省略很多东西的,aroluna问怎么办,呵呵,当然是——凉拌!
Feynman (KaKa) 在 ta 的帖子中提到:呵呵,lylover最怕这样的问题了...不过bioinfor更多是用来找规律的,而不是用来解决特例的,我这么认为
aroluna (踏雪寻芳踪) 在 ta 的帖子中提到:这个方法可行?也你比对后拼接的fullisoform根本就不存在呢?或者在某些情况下,有exon交换利用情况,怎么办?
───────────────────────────────────────
作者lylover(白愁飞(cinderella)),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月20日21:22:03星期天),转信
───────────────────────────────────────
yix做的工作,并没有说能够保证100%的准确率的,否则,就不需要做实验了的。生物信息不准确,那么,究竟多准确,做实验的人可以接受呢?100%准确的实验,好像也不见得能找到多少。
对于单个的gene,应该说,只有两种可能,对,或者是错。但是如果拿这个标准来要求生物信息,应该说,所有人做的所有的bioinformatics工作,都没有意义了。你总是可以找到特例的。
对于实验学者来说,计算提供给你的是一系列的结果,这里面大概准确率是多少,是测试过的,比如1000AS,可能会有70%对,但是,具体哪个对,哪个不对,则需要实验验证。
aroluna (踏雪寻芳踪) 在 ta 的帖子中提到:有这样一种现象,我做的那个gene实际是有12个exons的在它的genomestructure上但是事实是实验得到的全长的isoform是不利用exon7的那么如果这样子去预测的话,我觉得很多gene是和我做的gene有类似情况的,那么bioinformaticsprediction就不准确了,对于一大堆gene的database可行,并且还有一个概率上的可信性吧对于单个gene,很不实际的说,我是这么觉得
yix (Punk) 在 ta 的帖子中提到:ifyouhaveanESTwithanovelspliceform,thebestwaytogetthefulllengthisoformistodofull-lenghtisoformassemblyfromsplicegraphs.alternativelyyoucanuseareferencemRNAsequence(likeaRefSeqsequence)asthetemplate,andconstructyourisoformbyswappingsplicepatternsinthereferencesequencewithwhatisobservedinyourESTsequence.Checkthefollowingpapers.Youmighthavetodocertainamountofprogrammingbyyourselftoimplementthesemethods.KanZ,StatesD,GishW.SelectingforfunctionalalternativesplicesinESTs.GenomeRes.2002Dec;12(12):1837-45............................
───────────────────────────────────────
作者lylover(白愁飞(cinderella)),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月20日21:50:37星期天),转信
───────────────────────────────────────
没事啦,你说的没错了,我解释的也没有问题,站的立场不同,呵呵
aroluna (踏雪寻芳踪) 在 ta 的帖子中提到:我没有质疑的意思,lylover辛苦了,解释这么长啊,其实我的那个gene的exon7的不利用我一直就很有疑惑的,借题发挥了
───────────────────────────────────────
作者lylover(白愁飞(cinderella)),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月20日21:52:39星期天),转信
───────────────────────────────────────
能给出大致的结果已经很强了。真的能完全解决,那个,我对面的实验室岂不是可以关门了?〉
kingsyl (Healthyisfirst.) 在 ta 的帖子中提到:
做实验的提问往往是最直接的.前几天我就和一个做实验的合作过,为了解决她提的问题(预测一个相互作用位点),我努力寻找,计算,再寻找,...最后还是没有解决.最后给了一个大致的结果,希望能有好运.:)
aroluna (踏雪寻芳踪) 在 ta 的帖子中提到:^_^,我是做实验的嘛:)
Feynman (KaKa) 在 ta 的帖子中提到:呵呵,lylover最怕这样的问题了...不过bioinfor更多是用来找规律的,而不是原来解决特例的,我这么认为
───────────────────────────────────────
作者yix(Punk),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月20日22:35:58星期天),站内信件
───────────────────────────────────────
isee.yes,it'smyfaultnotputtingtheentiresetofinformationoutyet.thoseproteinsequencesareofcoursetranslatedfrommRNAisoformsequences.i'llbugourwebmanagerandputanentiremysqldumpofthedata(includinginforegardingexon,splice,splicegraphs,est,etc.)outsoon.ThomasBee (Tom) 在 ta 的帖子中提到:ASP?Butonlytranslatedproteinsequences.
───────────────────────────────────────
作者yix(Punk),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月20日22:40:16星期天),站内信件
───────────────────────────────────────
nowearenottalkingaboutPREDICTIONhere.wearetalkingaboutinferringfulllengthisoformsequencebasedonEVIDENCEofalternativespliceformfromfragmentaryexpressedsequencedata.Inyourcase,iftheESTdatapointsouttheexonskippingofexon7,thealgorithmshouldproperlyinfera2ndfulllengthsequencewhichcontainsonly11exons(skippingexon7).Peoplearenotenthusiaticaboutpredictingalternativesplicingatthismomentsincethecomplexityisjustoverwhelming.aroluna (踏雪寻芳踪) 在 ta 的帖子中提到:有这样一种现象,我做的那个gene实际是有12个exons的在它的genomestructure上但是事实是实验得到的全长的isoform是不利用exon7的那么如果这样子去预测的话,我觉得很多gene是和我做的gene有类似情况的,那么bioinformaticsprediction就不准确了,对于一大堆gene的database可行,并且还有一个概率上的可信性吧对于单个gene,很不实际的说,我是这么觉得
───────────────────────────────────────
作者yix(Punk),信区:Bioinformatics
标题Re:如何得到全长isoform的序列?
时间北大未名站(2004年06月20日22:49:34星期天),站内信件
───────────────────────────────────────
hehe.good.
weusedtohavewrittenquitelongargumenttoaddresssimilardoubtwhenourpaperisreviewed.onerefereeisquestioningtheconstructionoffull-lengthisoformfromESTdata,andcitingthatsomedatabasingeffort(likeHAWK)chosenottoutilizeESTdata.thisisourresponse.Ithinkit'sgeneralformanybioinformaticsresearch.thatistosay,therearetwosidesofthestory:validation(whereyouwanttominimizeFP)anddiscovery(whichyouwanttominimizeFNattheexpenseofreasonableFP).
TherefereeexpressesdoubtabouttheneedforESTsequenceassembly,thesubjectofourpaper.Specifically,therefereenotesthatsuchassemblieswillnotbeentirelyreliable,andthatadatabaseprojectforhuman-curatedgeneproducts(HAWK)haschosennottoattemptsuchassemblies.ToourmindsthisisanentirelyreasonablepositionforaprojectsuchasHAWK,whichwasdesignedtoprovidevalidated,human-curatedtranscriptsequences.Inthiscase,theprimaryconcernisvalidation(eliminatingfalsepositives,i.e.erroneoustranscriptsequences).
However,thisdoesnotconsiderthevalueofanothermajorareaofgenomicsresearch,namelydiscoveryofnovelgeneisoformsfromhigh-throughputdata.Inthiscase,theprimaryconcernisminimizingfalsenegatives(i.e.failuretoreportanovelisoformthatisindicatedbytheexperimentaldata),attheexpenseofallowingasmallfractionoffalsepositives.AsReferee2pointsoutwithrespecttofilteringofRNAsthatmayhaveimportantregulatoryfunctionsinsteadofencodingprotein(CommentsfortheAUTHOR,#3),failingtoreportanovelformisalsoaseriouserror(afalsenegative).ThegenomicscommunityneedsbothdatabaseslikeHAWKthatprovideavalidateddataset(attheexpenseofhavingamassivenumberoffalsenegatives),andmethods(likeours)thatprovidesensitivediscoveryofnovelisoformswhichhavenotyetbeenvalidated(attheexpenseofasmallfractionoffalsepositives).lylover (白愁飞(cinderella)) 在 ta 的帖子中提到:yix做的工作,并没有说能够保证100%的准确率的,否则,就不需要做实验了的。生物信息不准确,那么,究竟多准确,做实验的人可以接受呢?100%准确的实验,好像也不见得能找到多少。对于单个的gene,应该说,只有两种可能,对,或者是错。但是如果拿这个标准来要求生物信息,应该说,所有人做的所有的bioinformatics工作,都没有意义了。你总是可以找到特例的。对于实验学者来说,计算提供给你的是一系列的结果,这里面大概准确率是多少,是测试过的,比如1000AS,可能会有70%对,但是,具体哪个对,哪个不对,则需要实验验证。有这样一种现象,我做的那个gene实际是有12个exons的在它的genomestructure上...........................
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

主题

0

回帖

4882万

积分

论坛元老

Rank: 8Rank: 8

积分
48824836
热门排行