To view this email as a web page, click here.

newsletter banner

 

新年快乐

最近发布的Mascot Server版本引入了额外的机器学习功能。下面,我们将解释重新评分(rescoring)的含义以及其工作原理。

本月的重点刊物将介绍一种糖磷酸处理后的细菌微囊。

蛋白质推断是一个关键且常常被误解的步骤---了解Mascot是如何执行这一过程的。

 

2025.01, #122

机器学习是如何工作的?
使用Mascot发表的特色文章
蛋白质推断
关于Matrix Science
 

 

Mascot:25 年来值得信赖的质谱蛋白质鉴定参考标准

申请试用

 

如何用机器学习进行评分?

 

在蛋白质序列数据库中进行搜索时,总是既有正确的肽段匹配,也有不正确的肽段匹配。Mascot 离子得分的设计使正确的匹配结果大多得分较高,而不正确的匹配结果大多得分较低,但它并不是无懈可击的。由于多种原因,可能会出现错误匹配。例如,正确的序列可能不在数据库中,或质谱图中存在较高的噪声峰,这些噪声峰恰好与错误的序列匹配,从而获得更高的得分。

与正确的匹配相比,不正确的匹配通常存在系统性差异,例如precursor质量误差、电荷状态、漏切肽段数量、匹配的片段离子强度比例等。为了充分利用这一点,Mascot 集成了 Percolator,一个利用半监督机器学习来发现最佳区分因子的工具。Percolator 选择出最能区分正确与错误匹配的因素后,将它们压缩成一个单一的数值,即 后验错误概率(posterior error probability, PEP),并将其作为新的匹配评分(因此称为重评分,rescoring)。

大多数工作流程在启用重评分后都能受益,因为它通常会显著提高灵敏度——即使是在常规的人类胰蛋白酶样本数据库搜索中也不例外。然而,机器学习同样并非完美,有时可能出错。因此,我们认为让用户能够自行决定是否使用机器学习是非常重要的,您可以根据需要启用或禁用这一功能。

详细讨论见我们的博客

Illustration for blog summary

 

 

使用Mascot发表的特色文章

在这里,我们重点介绍了最近有趣且重要的文章,该文章采用Mascot进行蛋白质鉴定,定量或表征,如果您想要您的文章也在这里重点推荐,请发送给我们PDF或URL

 

Characterization of a widespread sugar phosphate-processing bacterial microcompartment

Matthew E. Dwyer, Markus Sutter & Cheryl A. Kerfeld

Nature Communications Biology, volume 7, Article number: 1562 (2024)

许多原核生物都会形成细菌微囊(BMCs),能够封装特定的代谢途径,以增强催化反应。本文作者通过生物信息学方法研究了一种功能尚未表征的细菌微囊——糖磷酸利用(SPU)微囊,推测其编码的基因参与糖磷酸代谢。作者对七种SPU亚型进行了表征,这些亚型均包含一个独特的酶——脱氧核糖5-磷酸醛缩酶(DERA),以及另一个常见的SPU酶——核糖5-磷酸异构酶(RPI)。

为了对这些酶进行功能表征,作者合成了带有N端组氨酸亲和标签的编码区域,以便进行纯化。由于在自然界中存在DERA和RPI的融合体,作者测试了这两种酶是否能形成复合物。通过尺寸排阻色谱,作者观察到一个主要峰值,分子量约为131 kDa。该峰值分馏物的SDS-PAGE分析和Western blot结果确认了RPI和DERA以大致相等的比例存在。通过质谱分析,使用Mascot Server、Mascot Distiller和Scaffold分析也证实了这一点,这很可能是首次实验性地表征了DERA与RPI之间的相互作用。

Thumbnail from featured publication

 

 

理解蛋白质推断

 

在利用鸟枪法 LC-MS/MS进行蛋白质鉴定时,蛋白质推断是一个关键但常常被误解的步骤。由于数据库搜索只能识别肽段,软件需要从这些识别出的肽段中推断出样品中最可能的蛋白质组成。

Mascot 采用了一种新颖的算法,利用特征肽段和共享肽段的信息来构建完整的蛋白质图谱。首先,根据共享的肽段匹配结果,将蛋白质聚类为“families”。接着,含有独特证据(即特征肽段)的蛋白质被提升为顶级家族成员(top-level family members)。而其他缺乏独特证据的蛋白质则被归为子集状态(subset status),默认情况下不会显示。

简而言之,Mascot 报告的每一个顶级蛋白质结果都由独特的MS/MS证据支持,用户可以通过查看肽段的碎裂图谱和匹配的离子证据来验证这些结果。Mascot 在线帮助文档中包含了算法的完整描述以及示例说明。

Illustration of Mascot tip

 

 

About Matrix Science

Matrix Science为蛋白组学的研究人员以及科学家提供生物信息分析工具,帮助大家更快速,更可信的鉴定和定量蛋白。Mascot每年被2000 多篇论文引用,软件全线支持来自Agilent, Bruker, Sciex, Shimadzu, Thermo Scientific和Waters质谱仪生成的质谱数据。

Matrix Science logo

联系我们或我们的营销合作伙伴,了解如何利用 Mascot 推动蛋白质组学研究的更多信息。

Mastodon   Bluesky   Twitter   LinkedIn   Youtube

 

Matrix Science Ltd, 64 Baker Street, London W1U 7GB, UK
T +44 (0)20 7486 1050  F +44 (0)20 7224 1344  E info@matrixscience.com
 

View in a web browser Forward to a colleague Unsubscribe