SỞ KHOA HỌC & CÔNG NGHỆ

TP. HỒ CHÍ MINH

TRUNG TÂM THÔNG TIN

KHOA HỌC - CÔNG NGHỆ

CỘNG H̉A XĂ HỘi CHỦ NGHĨA VIỆT NAM

Độc Lập - Tự Do - Hạnh Phúc

 

Số : 127/CV-TTTT

V/v: Thẩm định thông tin

        Đề tài nghiên cứu

Tp. Hồ Chí Minh, ngày 14   tháng 10  năm 2005

        

Kính gởi:

-         Pḥng Quản Lư Khoa Học
Sở Khoa Học & Công Nghệ

-         TS. Trần Văn Lăng

 

          Trung Tâm Thông Tin Khoa Học & Công Nghệ đă tiến hành thẩm định thông tin các tư liệu liên quan đến đề tài nghiên cứu "Xây dựng hệ thống tự động rút trích nội dung chính trong các văn bản điện tử tiếng Việt" do Phân viện Công Nghệ Thông Tin tại TP.HCM chủ tŕ và  TS. Trần Văn Lăng là chủ nhiệm đề tài. Trong phạm vi các nguồn thông tin tiếp cận được, Trung Tâm Thông Tin có ư kiến như sau:

Ngoài các tài liệu đă nêu trong phiếu khảo sát thông tin, c̣n có các tài liệu, nghiên cứu liên quan đến từng khía cạnh của nội dung đề tài, cụ thể:

I.      NƯỚC NGOÀI:

1.     Sáng chế:

·        Automatic subject cognitive analysis system in natural language analysis: Hệ thống tự động phân tích vấn đề trong xử lư ngôn ngữ tự nhiên.

·        Method and apparatus for automatic collection and summarization of meeting information: Phương pháp và công cụ cho việc tự động tóm tắt và thu thập thông tin.

·        Method for automatically generating a summarized text by a computer: Chỉ ra phương pháp cho phép tổng hợp tự động câu chính của một văn bản trên máy tính.

·        Text analysis system: hệ thống phân tích văn bản

·        Information processing expert system for text analysis and predicting public opinion based information available to the public: hệ chuyên gia xử lư thông tin trong phân tích văn bản

·        Document summarizer for word processors: tóm tắt tài liệu cho bộ xử lư văn bản

·        Text summarizing method and system: phương pháp và hệ thống tóm tắt văn bản.

·        Text structure analysis method and text structure analysis device: phương pháp và công cụ phân tích cấu trúc văn bản .

·        Method and system for English text analysis: hệ thống và phương pháp phân tích văn bản tiếng Anh.

2.     Tài liệu:

·        Unification-based adaptive parser: Tŕnh bày thuật toán phân tích cú pháp văn phạm. Tác giả Allen, Clement S. Bryant, Barrett R.

·        Natural language processing and logic programming: xử lư ngôn ngữ tự nhiên  chương tŕnh logic. Tác giả Dahl, Veronica.

·        SUMMARIST- Automated Text Summarization. Thiết kế và xây dựng hệ thống SUMMARIST để thực hiện tóm tắt văn bản, sử dụng sự kết hợp giữa kỹ thuật thống kê với ngôn ngữ học. Tác giả Eduard Hovy, Chin-Yew Lin   Daniel Marcu.

·        SeaSum - Search and Summarize: Mục tiêu của đề tài là xây dựng kỹ thuật tổng hợp văn bản tự động và tạo chỉ mục cho các ứng dụng tiếng Thụy Điển. Tác giả Dr. Hercules Dalianis,Johan Carlberger, Martin Hassel, Ola Knutsson, Erik Åström. 

3.     Sách:

·        Speech and language processing: Sách giới thiệu về xử lư ngôn ngữ tự nhiên, ngôn ngữ học máy tính và nhận dạng lời nói. Tác giả Daniel Jurafsky và James H. Martin.

·        Automatic Summarization (Natural Language Processing): xử lư ngôn ngữ tự nhiên. Tác giả  Inderjeet Mani. Nhà xuất bản John Benjamins Publishing Co, năm 2001.

·        Intelligent Text Summarization: Tóm tắt văn bản một cách thông minh. Tác giả Eduard Hovy và Dragomir Radey. Nhà xuất bản Amer Assn for Artificial; Spiral edition, năm 1998.

·        Automatic text processing: the transformation analysis and retrieval of information by computer: Xử lư văn bản tự động. Tác giả Gerard Salton. Nhà xuất bản Addison-Wesley Pub (Sd), năm 1988.

4.     Báo cáo khoa học

·        A method for word segmentation in Vietnamese: Đề xuất phương pháp phân đoạn từ ngữ theo cấu trúc văn phạm trong tiếng Việt.  Tác giả Le An Ha.

·        Lexical descriptions for Vietnamese language processing:  Mục đích đề tài là xây dựng một Cơ sở dữ liệu ngôn ngữ tiếng Việt dùng trong xử lư tự động tiếng Việt. Tác giả Nguyen Thanh Bon, Nguyen Thi Minh Huyen tại hội thảo NLPRS 2001: Tokyo, Japan.

5.     Phần mềm:

·        TextAlyser: là công cụ phân tích văn bản trực tuyến

·        TextSTAT:  là phần mềm phân tích văn bản đơn giản cho phép phân tích và hiển thị danh sách tần số xuất hiện của các từ trong văn bản, cho phép xử lư văn bản có mă unicode.

II.   TRONG NƯỚC:

1.     Đề tài nghiên cứu:

·        Nghiên cứu Web ngữ nghĩa và rút trích thông tin trên Web do Viện Khoa học và Công nghệ Việt Nam (IOIT-HCM). Chủ nhiệm KS. Đỗ Văn Long. Cơ quan chủ tŕ Phân viện Công nghệ thông tin tại TP. Hồ Chí Minh.

·        Nghiên cứu xây dựng chương tŕnh tra cứu và hỏi đáp thông minh bằng tiếng Việt. Chủ nhiệm  KS. Đỗ Văn Long. Cơ quan chủ tŕ Phân viện Công nghệ thông tin tại TP. Hồ Chí Minh.

·        Phát triển một số công cụ hỗ trợ phân tích, tổng hợp văn bản tiếng Việt. Chủ nhiệm TS. Đỗ Phúc. Cơ quan chủ tŕ Trung tâm Phát triển Công nghệ Thông tin, 2004.

2.  Báo cáo khoa học:

·        Ứng dụng xử lư ngôn ngữ tự nhiên trong hệ t́m kiếm thông tin trên văn bản tiếng Việt. Chủ nhiệm Đồng Thị Bích Thuỷ, Hồ Bảo Quốc. Khoa Công nghệ thông tin -Trường Đại học khoa học tự nhiên, TP HCM.

3.     Luận án:

·        Nghiên cứu một số đặc tính thống kê của văn bản Tiếng Việt. Tác giả Nguyễn Trung Phương, Luận văn Thạc sỹ . Trường ĐHBK Hà Nội.

·        Một số phương pháp xử lư văn bản Tiếng Việt tự động. Tác giả Lê Minh Hiền, Luận văn Thạc sỹ. Trường ĐHBK Hà Nội.

·        Trích cụm danh từ tiếng Việt nhằm phục vụ cho các hệ thống tra cứu thông tin đa ngôn ngữ. Tác giả Lại Thị Hạnh, Luận văn Thạc sĩ. Trường Đại Học Khoa Học Tự Nhiên TP. HCM.

 

Xin thông báo kết quả thẩm định của chúng tôi.

Trân trọng.

 

KT. GIÁM ĐỐC
PGĐ. Lương Tú Sơn

Nơi nhận:

-         Như trên

-         Lưu