藥物研發中對專利數據的挖掘和分析至關重要,但傳統方法依賴藥化專家手動整理大量專利,使用化學結構繪制工具手動繪制大量化學結構并標記活性數據,進行 SAR 分析,這個過程少則幾天,多則數周。
面對這一挑戰,晶泰科技攜手粵港澳大灣區數字經濟研究院(簡稱 “IDEA” 研究院),共同研發了專利數據挖掘平臺——PatSight,將這一過程時間縮短至 1 小時。(文末附試用鏈接)
PatSight,夢照現實
藥物研發專家只需要將專利 PDF 文件上傳至 PatSight,1h 即可得到所有的專利化合物數據,并且借助晶泰的 MolValley 平臺即可進行 SAR 分析獲得結果。
1. 一小時全自動識別結構、名稱、活性
? 90% 專利實現1小時內完成數據提取。
? 自動識別專利的實例編號與結構。
? 自動識別匹配同一化合物的所有活性數據。

2. 操作便捷友好
? 一鍵跳轉至分子結構和活性數據表格查看。
? 識別的結構與專利中原結構方向姿態一致,方便核驗。

3. 識別準確度高
? 對表格中實施例的結構識別準確率>95%。
? 對表格中活性數據的識別準確率>97%。

MolValley進行構效關系分析
針對 PatSight 提取的高質量數據,我們提供了云端的數據管理與分析平臺—— MolValley。MolValley 可以集中、系統的管理分子結構和活性數據,并提供構效關系分析工具,助力用戶高效的解析小分子化合物結構與生物活性間的奧秘。
案例分享
以一篇 FGFR2 相關的化合物專利(WO2020231990)為例,該專利包含 1500 個分子的結構與活性數據,涉及到的分子已進入臨床階段。為了尋找更深入的構效關系分析,我們將專利文件上傳至 PatSight,1 小時內提取專利中所有實施例的化合物編號、結構、Assay 信息、活性值。

通過 MolValley 的 SAR 分析模塊,我們迅速識別出了三個主要的高頻片段,然后結合活性數據、靶點口袋等信息,迅速找到多個潛在的構效關系模型,這對相關項目的后續開發至關重要。

新品上線,邀您試用
點擊下方鏈接,點擊 “立即體驗” 按鈕,完成注冊后即刻體驗(目前每位用戶可免費分析 3 篇/日)。
patent.xinsight-ai.com/home?ref=MC11X
