|
Sở Khoa Học và Công Nghệ TRUNG
TÂM THÔNG TIN KHOA
HỌC - CÔNG NGHỆ |
CỘNG
H̉A XĂ HỘi CHỦ NGHĨA VIỆT Độc
Lập - Tự Do -
Hạnh Phúc Tp. Hồ Chí Minh, ngày
2
tháng 6 năm 2004 |
Số :………./CV-TTTT
đề tài
nghiên cứu
|
Kính gởi: |
- Pḥng Quản Lư Khoa Học -
TS. Đỗ Phúc |
Trung Tâm Thông Tin Khoa
Học & Công Nghệ đă tiến hành thẩm định thông tin các tư
liệu liên quan đến đề tài nghiên cứu "Phát triển một số công cụ hỗ
trợ phân tích, tổng hợp văn bản tiếng Việt" do Trung tâm Phát triển
Công nghệ Thông tin chủ tŕ và Tiến
sĩ Đỗ Phúc là chủ nhiệm
đề tài. Trong phạm vi các nguồn
thông tin tiếp cận được, Trung Tâm Thông
Tin có ư kiến như sau:
Ngoài các tài liệu đă nêu trong phiếu
khảo sát thông tin, c̣n có các tài
liệu, nghiên cứu liên quan đến từng khía cạnh của nội dung đề tài, cụ thể:
I.
Trong
nước :
1. Đề tài nghiên cứu:
o
Luận văn Thạc
sỹ chuyên ngành Công nghệ
thông tin: “Nghiên cứu một số đặc tính thống kê của văn bản Tiếng Việt” của tác giả Nguyễn Trung Phương, Trường
ĐHBK Hà nội.
Địa chỉ Website:
http://news.hut.edu.vn/library/2003/dientu.htm
o
Luận văn Thạc
sỹ ngành Công nghệ thông tin: “Một số phương pháp xử lư văn
bản Tiếng Việt tự động” của
tác giả Lê Minh Hiền,
Trường ĐHBK Hà
nội
Địa chỉ Website:
http://news.hut.edu.vn/library/2003/dientu.htm
o
Luận văn Thạc
sĩ “Trích cụm danh từ tiếng
Việt nhằm phục vụ cho các hệ
thống tra cứu thông tin đa ngôn ngữ”
của tác giả Lại Thị Hạnh, trường Đại Học Khoa Học Tự Nhiên TP. HCM
2. Báo cáo khoa hoc:
“Ứng dụng xử lư ngôn ngữ
tự nhiên trong hệ t́m kiếm thông tin trên văn bản tiếng Việt” của tác giả
Đồng Thị Bích Thủy, Hồ Bảo Quốc, Khoa Công Nghệ Thông Tin - Đại học khoa học tự nhiên TP. HCM.
Địa chỉ
website:
http://www-clips.imag.fr/mrim/User/quoc.ho-bao/IRVN0803.pdf
II. Nước ngoài:
1.
Đề tài nghiên cứu:
http://www.isi.edu/natural-language/projects/nlg-projects.html
o Đề tài “SeaSum - Search and Summarize" của tác giả Dr. Hercules Dalianis,Johan Carlberger
, Martin Hassel, Ola Knutsson, Erik Åström. Mục tiêu của đề tài là xây dựng kỹ thuật tổng hợp văn bản tự động và tạo chỉ mục cho các ứng dụng tiếng Thụy Điển.http://www.nada.kth.se/~hercules/seasum.html
2. Một số phần mềm phân tích văn
bản:
o “TextAlyser” là công cụ phân
tích văn bản trực tuyến tại địa chỉ website http://textalyser.net/index.php
o
“TextSTAT” là
phần mềm phân tích văn
bản đơn giản cho phép phân tích
và hiển thị danh sách tần số xuất hiện của các từ trong
văn bản, cho phép xử
lư văn bản có mă
unicode.
Địa chỉ website:
http://www.niederlandistik.fu-berlin.de/textstat/TextSTAT-Doku-EN.html
3. Sách tham khảo:
o
Advances in Automatic Text Summarization, tác giả Inderjeet Mani và Mark T. Maybury.
o
Automatic
Summarization (Natural Language Processing), tác
giả Inderjeet Mani.
III. Patent (nguồn
có tại Trung tâm Thông
tin KH&CN)
o
Số Patent 5392428: Text analysis system
o
Số Patent 4930077: Information processing expert system for
text analysis and predicting public opinion based information available to the
public
o
Số Patent 5924108: Document summarizer for word processors
o
Số Patent 5978820: Text summarizing method and system
o
Số Patent 6263336: Text structure analysis method and text
structure analysis device
o
Số Patent 5737617: Method
and system for English text analysis
Xin thông báo kết quả
thẩm định của chúng tôi.
Trân trọng.
GIÁM ĐỐC
Nơi nhận:
-
Như trên
-
Lưu