Học giả ngữ nghĩa

Article

July 4, 2022

Semantic Scholar là một công cụ tìm kiếm được hỗ trợ bởi trí thông minh nhân tạo cho các ấn phẩm học thuật được phát triển tại Allen Institute for AI và được phát hành công khai vào tháng 11 năm 2015. Nó sử dụng những tiến bộ trong xử lý ngôn ngữ tự nhiên để cung cấp tóm tắt cho các bài báo học thuật. Nhóm Semantic Scholar đang tích cực nghiên cứu việc sử dụng trí thông minh nhân tạo trong xử lý ngôn ngữ tự nhiên, máy học, tương tác giữa con người với máy tính và truy xuất thông tin. Tuy nhiên, vào năm 2017, hệ thống bắt đầu đưa tài liệu y sinh vào kho tài liệu của nó. Kể từ tháng 11 năm 2021, chúng hiện bao gồm các ấn phẩm từ tất cả các lĩnh vực khoa học.

Công nghệ

Học giả ngữ nghĩa cung cấp bản tóm tắt một câu của tài liệu khoa học. Một trong những mục đích của nó là giải quyết thách thức của việc đọc nhiều tiêu đề và tóm tắt dài dòng trên thiết bị di động. Nó cũng cố gắng đảm bảo rằng ba triệu bài báo khoa học được xuất bản hàng năm đến được với độc giả vì ước tính chỉ một nửa số tài liệu này được đọc. Dự án sử dụng sự kết hợp giữa học máy, xử lý ngôn ngữ tự nhiên và thị giác máy để thêm một lớp phân tích ngữ nghĩa vào các phương pháp phân tích trích dẫn truyền thống và trích xuất các số liệu, bảng, thực thể và địa điểm có liên quan từ các bài báo. Scholar và PubMed, Semantic Scholar được thiết kế để làm nổi bật các yếu tố quan trọng và có ảnh hưởng nhất của một bài báo. Công nghệ AI được thiết kế để xác định các kết nối ẩn và liên kết giữa các chủ đề nghiên cứu. Giống như các công cụ tìm kiếm được trích dẫn trước đây, Semantic Scholar cũng khai thác các cấu trúc đồ thị, bao gồm Sơ đồ Kiến thức Học thuật của Microsoft, Springer Nature's SciGraph và Semantic Scholar Corpus. viết tắt S2CID). Mục nhập sau là một ví dụ: Liu, Ying; Gayle, Albert A; Wilder-Smith, Annelies; Rocklöv, Joacim (tháng 3 năm 2020). "Số lượng sinh sản của COVID-19 cao hơn so với coronavirus SARS". Tạp chí Y học Du lịch. 27 (2). doi: 10.1093 / jtm / taaa021. PMID 32052846. S2CID 211099356.Semantic Scholar được sử dụng miễn phí và không giống như các công cụ tìm kiếm tương tự (tức là Google Scholar) không tìm kiếm tài liệu ẩn sau tường phí. công cụ tìm kiếm chính xác 98,88% khi cố gắng khám phá dữ liệu. Nghiên cứu tương tự đã kiểm tra các chức năng Semantic Scholar khác, bao gồm các công cụ để khảo sát siêu dữ liệu cũng như một số công cụ trích dẫn.

Số lượng người dùng và xuất bản

Tính đến tháng 1 năm 2018, sau một dự án năm 2017 bổ sung các bài báo y sinh và tóm tắt chủ đề, kho ngữ liệu Semantic Scholar bao gồm hơn 40 triệu bài báo từ khoa học máy tính và y sinh. Vào tháng 3 năm 2018, Doug Raymond, người đã phát triển các sáng kiến ​​học máy cho nền tảng Amazon Alexa, đã được thuê để lãnh đạo dự án Semantic Scholar. Tính đến tháng 8 năm 2019, số lượng siêu dữ liệu giấy tờ đi kèm (không phải tệp PDF thực tế) đã tăng lên hơn 173 triệu sau khi bổ sung hồ sơ Microsoft Academic Graph. Vào năm 2020, sự hợp tác giữa Semantic Scholar và Tạp chí Báo chí của Đại học Chicago đã làm cho tất cả các bài báo được xuất bản trong Nhà xuất bản Đại học Chicago đều có trong kho ngữ liệu Semantic Scholar. Vào cuối năm 2020, Semantic Scholar đã lập chỉ mục 190 triệu bài báo. Năm 2020, người dùng Semantic Scholar đạt 7 triệu người mỗi tháng.

Xem thêm

Phân tích trích dẫn - Kiểm tra tần suất, mẫu và biểu đồ của các trích dẫn trong tài liệu Chỉ mục trích dẫn - Chỉ số trích dẫn giữa các lần xuất bản Khai thác kiến ​​thức - Tạo ra kiến ​​thức từ các nguồn có cấu trúc và phi cấu trúc Danh sách cơ sở dữ liệu học thuật và công cụ tìm kiếm Scientom