|
SỞ KHOA HỌC &
CÔNG NGHỆ TP.
HỒ CHÍ MINH TRUNG TÂM THÔNG TIN KHOA HỌC - CÔNG NGHỆ |
CỘNG H̉A XĂ HỘi CHỦ
NGHĨA VIỆT Độc Lập - Tự Do -
Hạnh Phúc |
|
Số : 127/CV-TTTT V/v: Thẩm định thông tin Đề tài nghiên cứu |
Tp.
Hồ Chí Minh, ngày 14 tháng 10 năm 2005 |
|
Kính
gởi: |
-
Pḥng Quản Lư Khoa Học -
TS. Trần Văn Lăng |
Trung
Tâm Thông Tin Khoa Học & Công Nghệ đă tiến hành
thẩm định thông tin các tư liệu liên quan
đến đề tài nghiên cứu "Xây dựng hệ thống tự động rút
trích nội dung chính trong các văn bản điện
tử tiếng Việt" do Phân viện Công Nghệ
Thông Tin tại TP.HCM chủ tŕ và
TS. Trần Văn Lăng là chủ
nhiệm đề tài. Trong phạm vi
các nguồn thông tin tiếp cận được, Trung Tâm
Thông Tin có ư kiến như sau:
Ngoài các tài liệu
đă nêu trong phiếu khảo sát thông tin, c̣n có các tài
liệu, nghiên cứu liên quan đến từng khía
cạnh của nội dung đề tài, cụ thể:
I.
NƯỚC NGOÀI:
1.
Sáng chế:
·
Automatic
subject cognitive analysis system in natural language analysis: Hệ
thống tự động phân tích vấn đề trong
xử lư ngôn ngữ tự nhiên.
·
Method and
apparatus for automatic collection and summarization of meeting information: Phương
pháp và công cụ cho việc tự động tóm tắt và thu thập thông tin.
·
Method for
automatically generating a summarized text by a computer: Chỉ
ra phương pháp cho phép tổng hợp tự động
câu chính của một văn bản trên máy tính.
·
Text
analysis system: hệ thống phân tích văn bản
·
Information
processing expert system for text analysis and predicting public opinion based
information available to the public: hệ chuyên gia xử lư
thông tin trong phân tích văn bản
·
Document
summarizer for word processors: tóm tắt tài liệu cho
bộ xử lư văn bản
·
Text
summarizing method and system: phương pháp và hệ
thống tóm tắt văn bản.
·
Text
structure analysis method and text structure analysis device:
phương pháp và công cụ phân tích cấu trúc văn bản .
·
Method and
system for English text analysis: hệ thống và
phương pháp phân tích văn bản tiếng Anh.
2.
Tài liệu:
·
Unification-based
adaptive parser: Tŕnh bày thuật toán phân tích cú pháp
văn phạm. Tác giả Allen, Clement S. Bryant, Barrett R.
·
Natural
language processing and logic programming: xử lư ngôn ngữ
tự nhiên và chương
tŕnh logic. Tác giả Dahl, Veronica.
·
SUMMARIST-
Automated Text Summarization. Thiết kế và xây
dựng hệ thống SUMMARIST để thực hiện
tóm tắt văn bản, sử dụng sự kết
hợp giữa kỹ thuật thống kê với ngôn
ngữ học. Tác giả Eduard Hovy,
Chin-Yew Lin và Daniel Marcu.
·
SeaSum -
Search and Summarize: Mục tiêu của đề tài là xây
dựng kỹ thuật tổng hợp văn bản
tự động và tạo chỉ mục cho các ứng
dụng tiếng Thụy Điển. Tác giả Dr. Hercules Dalianis,Johan
Carlberger, Martin Hassel, Ola Knutsson, Erik Åström.
3.
Sách:
·
Speech and
language processing: Sách giới thiệu về xử lư
ngôn ngữ tự nhiên, ngôn ngữ học máy tính và nhận
dạng lời nói. Tác giả Daniel Jurafsky và James H. Martin.
·
Automatic
Summarization (Natural Language Processing): xử
lư ngôn ngữ tự nhiên. Tác giả Inderjeet Mani. Nhà xuất
bản John Benjamins Publishing Co, năm 2001.
·
Intelligent
Text Summarization: Tóm tắt văn bản một cách thông
minh. Tác giả Eduard Hovy và Dragomir Radey. Nhà xuất bản
Amer Assn for Artificial; Spiral edition, năm 1998.
·
Automatic
text processing: the transformation analysis and retrieval of information by
computer: Xử lư văn bản tự động. Tác
giả Gerard Salton. Nhà xuất bản Addison-Wesley Pub (Sd), năm 1988.
4.
Báo cáo khoa học
·
A method
for word segmentation in Vietnamese: Đề xuất
phương pháp phân đoạn từ ngữ theo cấu trúc văn phạm trong tiếng
Việt. Tác giả Le An
Ha.
·
Lexical
descriptions for Vietnamese language processing: Mục đích đề tài là xây
dựng một Cơ sở dữ liệu ngôn ngữ
tiếng Việt dùng trong xử lư tự động
tiếng Việt. Tác giả Nguyen Thanh Bon, Nguyen Thi Minh Huyen
tại hội thảo NLPRS 2001:
5.
Phần mềm:
·
TextAlyser: là công
cụ phân tích văn bản trực tuyến
·
TextSTAT: là phần mềm phân tích văn
bản đơn giản cho phép phân tích và hiển thị
danh sách tần số xuất hiện của các từ trong
văn bản, cho phép xử lư văn bản có mă unicode.
II.
TRONG NƯỚC:
1.
Đề tài nghiên cứu:
·
Nghiên
cứu Web ngữ nghĩa và rút trích thông tin trên Web do
Viện Khoa học và Công nghệ Việt
·
Nghiên
cứu xây dựng chương tŕnh tra cứu và hỏi
đáp thông minh bằng tiếng Việt. Chủ
nhiệm KS.
Đỗ Văn Long. Cơ quan chủ tŕ Phân viện Công
nghệ thông tin tại TP. Hồ Chí Minh.
·
Phát
triển một số công cụ hỗ trợ phân tích,
tổng hợp văn bản tiếng Việt. Chủ
nhiệm TS. Đỗ Phúc. Cơ quan chủ tŕ Trung tâm Phát
triển Công nghệ Thông tin, 2004.
2. Báo cáo khoa
học:
·
Ứng
dụng xử lư ngôn ngữ tự nhiên trong hệ t́m
kiếm thông tin trên văn bản tiếng Việt. Chủ
nhiệm Đồng Thị Bích Thuỷ, Hồ Bảo
Quốc. Khoa Công nghệ thông tin -Trường Đại
học khoa học tự nhiên, TP HCM.
3.
Luận án:
·
Nghiên
cứu một số đặc tính thống kê của
văn bản Tiếng Việt. Tác giả Nguyễn Trung
Phương, Luận văn Thạc sỹ .
Trường ĐHBK Hà Nội.
·
Một
số phương pháp xử lư văn bản Tiếng
Việt tự động. Tác giả Lê Minh Hiền, Luận
văn Thạc sỹ. Trường ĐHBK Hà Nội.
·
Trích
cụm danh từ tiếng Việt nhằm phục vụ
cho các hệ thống tra cứu thông tin đa ngôn ngữ. Tác
giả Lại Thị Hạnh, Luận văn Thạc
sĩ. Trường Đại Học Khoa Học Tự
Nhiên TP. HCM.
Xin thông báo
kết quả thẩm định của chúng tôi.
Trân trọng.
|
|
KT. GIÁM ĐỐC |
Nơi nhận:
-
Như trên
-
Lưu