哪个数据库可以实现化学结构式检索
哪个数据库可以实现化学结构式检索:ChemSpider。
ChemSpider是一个免费的化学结构数据库,提供对来自数百个数据源的超过 1 亿个结构的快速文本和结构搜索访问。
数据库系统(database systems),是由数据库及其管理软件组成的系统。它是为适应数据处理的需要而发展起来的一种较为理想的数据处理的核心机构。它是一个实际可运行的存储、维护和应用系统提供数据的软件系统,是存储介质、处理对象和管理系统的集合体。
数据库性能
1.能够保证数据的独立性。数据和程序相互独立有利于加快软件开发速度,节省开发费用。
2.几余数据少,数据共享程度高。
3.系统的用户接口简单,用户容易掌握,使用方便。
4.能够确保系统运行可靠,出现故幢时能迅速排除,能够保护数据不受非受权者访问或破坏,能够防止错误数据的产生,一旦产生也能及时发现。
5.有重新组织数据的能力,能改变数据的存储结构或数据存储位置,以适应用户操作特性的变化,改善由于频整插入、删除操作造成的数据组织零乱和时空性能变坏的状况。
6.具有可修改性和可扩充性。
7.能够充分描述数据间的内在联系。
2024-10-28 广告
我将介绍几种支持化学结构式检索的平台,旨在帮助化学领域研究人员更高效地进行化合物的识别和信息查询。
在化学研究领域,结构式检索是一项至关重要的检索方式,它使研究人员通过化合物的部分或完整结构来查找相关信息,这对于解决实际工作中遇到的一些常见问题非常有帮助。例如,当研究人员遇到一个已知部分结构但未知名称的化合物时,结构式检索能够提供极大的便利。通过绘制或上传化合物的结构式,研究人员可以快速检索到相关的化合物信息,包括名称、分子式、物理化学性质、生物活性等。
1、CAS SciFindern数据库
【网址】:https://scifinder-n.cas.org
CAS SciFindern由美国化学会(American Chemical Society, ACS)旗下的美国化学文摘社(Chemical Abstracts Service, CAS)出品,是一个研发应用平台,提供全球最大、最权威的化学及相关学科文献、物质和反应信息。综合了全球200多个国家和地区的60多种语言的1万多份期刊,内容丰富全面,用户可以通过主题、分子式、结构式和反应式等多种方式进行检索。该平台汇集了180多个国家、50多种语言出版的文献及64家专利授权机构的专利,包含5900万化学及相关学科文献、2.04亿化学物质、1.5亿化学反应、139万来自专利的马库什结构、化学品商业信息及管控信息,最早回溯至1840年。
CAS SciFindern的一大特色是可以提供专利马库什结构的机构。平台从全球64家专利机构的公开专利中提取了超过139万个可检索的马库什结构,一个马库什结构可能涵盖数千甚至数万个化合物,这大大增强了研发和知识产权专业人士在进行化合物结构的新颖性和创造性搜索、发现相似专利以及评估潜在侵权风险的能力。并且其中的CAS PatentPak模块在定位和分析大量专利中的化学结构方面,采用人工标引,检索人员可以快速识别专利中难以发现的物质(例如,表格化合物和图形图像内的化合物)。该平台的另一特色是其含有7.2亿生物序列,可进行FTO检索、侵权检索,可以更好的服务与研发人员及知识产权相关行业人士。CAS SciFindern数据库中还包括一个反应信息数据库CASReact,收集了各种反应与制备信息。
2、Reaxys数据库
【网址】:https://www.reaxys.com
Reaxys数据库是目前最大的化学数据库,其收录的数据范围涵盖有机合成、药物化学、天然产物化学、无机化学和金属有机化学,并将化学反应,化合物物性数据,合成线路设计进行无缝对接,使科技检索工作更加高效、精准,并以其强大的检索功能和深入的核心信息摘录为化学研究注入新的生机。Reaxys 将十多亿个化学数据点与人工智能相结合,为药物发现、化学研发和学术界的创新提供支持。化学家可以快速获取相关的专利、物质和生物活性见解以及屡获殊荣的逆合成工具。Reaxys在Beilstein基础上整合了盖墨林(Gmelin)和专利化学数据库(PCD)以及化学相关期刊的内容,能帮助科研人员快速全面地查询化合物的理化数据,设计经济、高效的合成路线,最大程度节省时间和资金成本。 其收录的数据范围涵盖有机合成、药物化学、天然产物化学、无机化学和金属有机化学,并将化学反应,化合物物性数据,合成线路设计进行无缝对接,使科技检索工作更加高效、精准,并以其强大的检索功能和深入的核心信息摘录为化学研究注入新的生机。在进行结构式检索时,Reaxys 提供了多种检索模式和工具,以帮助用户精确地找到所需的化合物和反应信息。
3、Web of Science数据库
【网址】:https://www.webofscience.com
Web of Science数据库(简称:wos)是获取全球学术信息的重要数据库,它收录了全球2万多种权威的、高影响力的学术期刊,超过20万份会议记录以及10万多种科技图书的题录摘要,内容涵盖自然科学、生物医学、工程技术、社会科学、艺术与人文等领域。其中德温特专利情报数据(Derwent Innovations Index,简称DII)结合了来自Derwent World Patents Index 和Derwent Patents Citation Index 的专利信息资源,支持快速而精确的专利和引文检索,内容涵盖化学、电气、电子和机械工程等领域,借助附加的描述信息和编码以及可追溯到1963年的专利收录内容。
wos也提供结构式检索功能,在进入Web of Science 网页可以直接选择“化学结构”,即可进行检索,支持结构式、化合物数据及反应数据检索,支持mol文件的导入及下载。检索结果提供WOS平台上的相关文献,可查看化学反应文献。
4、MolAid化合物智能检索一体化平台
【网址】:https://rxn.molaid.com
MolAid是由碳氢数科打造的一个功能强大的化合物检索数据库,它为化学研究者提供了一个全面而专业的有机化合物检索平台。收录全球数以亿计的化学品数据,提供精准数据信息,包括物化性质、毒理性、反应、文献、晶体、谱图、安全等信息数据。支持查询化合物、了解物质性质、寻找购买信息、查询反应条件、设计反应路线、谱图查询、预测性质及谱图等,实现合成实验全场景覆盖。MolAid提供多种检索方式可针对不同的用户场景,面对复杂化合物,可以采取绘制结构进行查询。进入官网页面后点击按钮可进行绘制检索。
5、智慧芽化学结构数据库
【网址】:https://chemical.zhihuiya.com
智慧芽化学结构数据库将化学结构检索与来自113个国家/地区的专利数据进行了深度整合,形成了一个提供全面检索和深度分析的一体化平台。该平台旨在为化学研发和知识产权专业人士提供研发机会挖掘和市场差异化创新的机会,并有力地避免诉讼风险。拥有超过2.5亿+的大数据集,为广度与深度探索新药领域的先导化合物提供了丰富的结构式与技术文献参考。持有4773万+的化学专利,累积收录2522万+的化学文献,其中包含丰富的药品生产工艺信息,为研发人员提供深度参考。持有4773万+的化学专利,专利范围覆盖113个国家和地区。该数据库的其检索结果有三部分:化合物、相关专利、相关文献。支持多种化学结构和性质搜索方式,一次查询就能检索到全部同义词,满足各类化合物的查找需求。
6、药智数据库-结构式检索数据库
【网址】:https://db.yaozh.com
结构式检索数据库是为提供化学结构式检索功能的数据库,目前主要收录了化学药物、中间体、化学杂质等结构式,数据含盖70余万条以及相关的关联信息。轻松通过化学结构式检索出数据库中对应此化学品的相关信息,如:英文名、化学名、分子式、CAS号等等。数据收集范围涵盖已上市或在研小分子化合物,以及杂质对照品等数据。可实现对小分子结构的精确结构、子结构检索及相似结构的检索,解决化学信息数据库文本检索存在的问题。在操作中点击“结构式搜索”,在结构编辑器中绘制结构式,选择精确检索、子结构检索、相似检索中的任意一种,系统将自动匹配到相应的化合物。
7、PubChem数据库
【网址】:https://pubchem.ncbi.nlm.nih.gov
PubChem数据库即有机小分子生物活性数据,是一种化学模组的数据库,由美国国家健康研究院( US National Institutes of Health,NIH)支持,美国国家生物技术信息中心负责维护。PubChem数据库包括 3个子数据库:PubChem BioAssay 库用于存储生化实验数据,实验数据主要来自高通量筛选实验和科技文献;PubChem Compound 库用于存储整理后的化合物化学结构信息;PubChem Substance 用于存储机构和个人上传的化合物原始数据。
目前收录有化合物11800万种、物质31800万种、生物活性29500万种、相关文献4100万篇、专利5100万篇。可以按名称、分子式、结构和CAS标识符等搜索,结构搜索支持mol等格式文件的导入和导出。PubChem数据库中的化学结构检索提供了方便的化学结构编辑器,用户可手动绘制化学结构或提供结构smiles文件格式检索。PubChem 检索可得到的结果包含了分子式、SMILES、2D和3D结构、InChI和InChIKey、相对分子质量、脂水分配系数、氢键受体和供体数目、可旋转键数目、互变异构体数目等基本的结构信息和物化性质,除此以外,还有该化合物作为药物的剂型和商品信息、药理性质、毒性、生物活性检测等信息,并通过文献分类副标题可以查看相关文献。
8、ChEMBL数据库
【网址】:https://www.ebi.ac.uk/chembl
ChEMBL数据库是欧洲生物信息研究所(European Bioinformatics Institute,EBI)开发的一个大型开放访问的数据库,包含了临床实验药物和批准药物的治疗靶标和适应症,大量类药化合物的生物活性、靶点结合、功能和ADMET 信息,获取这些数据可以进行多种类型的药物发现分析和决策。CHEMBL数据库目前包含了2,431,025个化合物、1644390个分析数据和89,892文献等。ChEMBL提供简单检索和高级检索选项,简单检索可输入药物名称,化合物名称,SMILES,靶点名称等;高级检索有三种模式,化合物检提供绘制结构,选择相似度进行筛选,蛋白质通过输入序列进行检索,也可以通过ChEMBL ID进行检索。
9、ZINC数据库
【网址】:http://zinc.docking.org
Zinc是由美国加州大学旧金山分校(UCSF)创建和维护的数据库。该数据库汇集了大量化合物的信息,提供化合物的二维或三维结构以及各种附加信息。ZINC是一个公共访问数据库和工具集,最初目的是为了方便访问用于虚拟筛选的化合物数据,这些数据广泛用于虚拟筛选、配体发现、药效团筛选、基准测试、和力场开发。ZINC将化合物与它们调节的蛋白质和生物过程联系起来。Zinc数据库中的化合物可以通过多种方式进行检索和筛选,包括结构相似性搜索、化学性质过滤、生物活性数据筛选等。用户可以根据特定的药物设计需求,使用这些搜索工具来获取合适的化合物。
10、ChemExper
【网址】:http://www.chemexper.com
Chemexper是一个把化学,计算机科学和电信等领域联系起来的一个公司。 Chemexper在网站上提供了化学物质搜索引擎Finding chemicals。可以通过CAS登记号、目录号和分子式、分子名称等形式进行检索。还提供了一个插件程序,通过这个技术,化学供应商可以在自己的网站上提供超文本链接标识语言,所有的疑问都可以通过Chemexper上的服务器进行解答。 Chemexper在网站上提供了ChemExper Chemical Directory(CCD)数据库,该数据库免费使用,所有人都可以通过Expereact Web提交信息,并在网站浏览器上重新得到信息。CCD包含了11,390,929化学物质结构,16,000材料安全数据表,100,000带有各种信息的产品。ChemExper支持化合物名称、结构式、CAS号、SMILES等检索,检索结果除了提供结构预览,还可下载mol格式的结构源文件,可导入到ChemDraw、ISIS Draw、Sybyl等软件中。此外,还可查看供应商信息。
这些平台的共同点在于它们都提供了丰富的结构数据和强大的分析工具,帮助科学家们在分子层面上理解物质的性质和功能。随着计算能力的提升和数据存储技术的不断进步,这些数据库的容量和功能都在持续扩大和优化,极大地增强了科研工作的效率和深度。我们可以根据自己的研究需求,选择最适合的数据库进行信息检索和分析。