Sở Khoa Học Công Nghệ

TRUNG TÂM THÔNG TIN

KHOA HỌC - CÔNG NGHỆ

 

        CỘNG H̉A XĂ HỘi CHỦ NGHĨA VIỆT NAM

                        Độc Lập - Tự Do - Hạnh Phúc

 

Tp. Hồ Chí Minh, ngày  2  tháng  6  năm 2004

Số :………./CV-TTTT                                                                   

V/v: Thẩm định thông tin

       đề tài nghiên cứu 

 

Kính gởi:

-       Pḥng Quản Khoa Học
Sở Khoa Học Công Nghệ TPHCM

-       TS. Đỗ Phúc

                                        

 

 

          Trung Tâm Thông Tin Khoa Học & Công Nghệ đă tiến hành thẩm định thông tin các liệu liên quan đến đề tài nghiên cứu "Phát triển một số công cụ hỗ trợ phân tích, tổng hợp văn bản tiếng Việt" do Trung tâm Phát triển Công nghệ Thông tin chủ tŕ Tiến sĩ  Đỗ Phúc chủ nhiệm đề tài. Trong phạm vi các nguồn thông tin tiếp cận được, Trung Tâm Thông Tin ư kiến như sau:

Ngoài các tài liệu đă nêu trong phiếu khảo sát thông tin, c̣n các tài liệu, nghiên cứu liên quan đến từng khía cạnh của nội dung đề tài, cụ thể:

 

       I.      Trong nước :

1. Đề tài nghiên cứu:

o       Luận văn Thạc sỹ chuyên ngành Công nghệ thông tin: Nghiên cứu một số đặc tính thống của văn bản Tiếng Việtcủa tác giả Nguyễn Trung Phương, Trường ĐHBK nội.

Địa chỉ Website:

http://news.hut.edu.vn/library/2003/dientu.htm

 

o       Luận văn Thạc sỹ ngành Công nghệ thông tin: Một số phương pháp xử văn bản Tiếng Việt tự độngcủa tác giả Minh Hiền, Trường ĐHBK nội

Địa chỉ Website:

http://news.hut.edu.vn/library/2003/dientu.htm

 

o       Luận văn Thạc   Trích cụm danh từ tiếng Việt nhằm phục vụ cho các hệ thống tra cứu thông tin đa ngôn ngữcủa tác giả Lại Thị Hạnh, trường Đại Học Khoa Học Tự Nhiên TP. HCM

 

2. Báo cáo khoa hoc:

Ứng dụng xử ngôn ngữ tự nhiên trong hệ t́m kiếm thông tin trên văn bản tiếng Việtcủa tác giả Đồng Thị Bích Thủy, Hồ Bảo Quốc, Khoa Công Nghệ Thông Tin - Đại học khoa học tự nhiên TP. HCM.

Địa chỉ website:

http://www-clips.imag.fr/mrim/User/quoc.ho-bao/IRVN0803.pdf

 

    II.      Nước ngoài:

1.  Đề tài nghiên cứu:

o       Đề tài “SUMMARIST- Automated Text Summarization” của các tác giả Eduard Hovy, Chin-Yew Lin   Daniel Marcu. Thiết kế xây dựng hệ thống SUMMARIST để thực hiện tóm tắt văn bản, sử dụng sự kết hợp giữa kỹ thuật thống với ngôn ngữ học.

Địa chỉ trang web:

http://www.isi.edu/natural-language/projects/nlg-projects.html

o       Đề tàiSeaSum - Search and Summarize" của tác giả Dr. Hercules Dalianis,Johan Carlberger

, Martin Hassel, Ola Knutsson, Erik Åström. Mục tiêu của đề tài xây dựng kỹ thuật tổng hợp văn bản tự động tạo chỉ mục cho các ứng dụng tiếng Thụy Điển.

Địa chỉ trang web:

http://www.nada.kth.se/~hercules/seasum.html

 

 

2.     Một số phần mềm phân tích văn bản:

o       TextAlyser công cụ phân tích văn bản trực tuyến tại địa chỉ website http://textalyser.net/index.php

 

o       TextSTAT phần mềm phân tích văn bản đơn giản cho phép phân tích hiển thị danh sách tần số xuất hiện của các từ trong văn bản, cho phép xử văn bản unicode.

Địa chỉ website:

http://www.niederlandistik.fu-berlin.de/textstat/TextSTAT-Doku-EN.html

 

3. Sách tham khảo:

o       Advances in Automatic Text Summarization, tác giả Inderjeet Mani Mark T. Maybury.

o       Automatic Summarization (Natural Language Processing), tác giả  Inderjeet Mani.

 

 

 III.      Patent (nguồn tại Trung tâm Thông tin KH&CN)

o       Số Patent 5392428: Text analysis system

o       Số Patent 4930077: Information processing expert system for text analysis and predicting public opinion based information available to the public

o       Số Patent 5924108: Document summarizer for word processors

o       Số Patent 5978820: Text summarizing method and system

o       Số Patent 6263336: Text structure analysis method and text structure analysis device

o       Số Patent 5737617:  Method and system for English text analysis

Xin thông báo kết quả thẩm định của chúng tôi.

Trân trọng.

    GIÁM ĐỐC

 

 

 

Nơi nhận:

-         Như trên

-         Lưu