Luận án: Xin phép và hồi đáp trong tiếng anh và tiếng việt, HAY
agents that_communicate
1. Đề tài :
Agents that Communicate
Thành viên nhóm :
Nguyễn Tiến Nam
Phạm Ngọc Hải
Trần Văn Trọng
Nguyễn Thanh Hào
Nguyễn Quang Minh
Phạm Xuân Bách
Nguyễn Thành Hữu
Đào Thị Thu Hiền
Nguyễn Tiến Đạt
2. Nội dung
Communication as Action
Types of Communicating Agents
A Formal Grammar for a Subset of English
Syntactic Analysis (Parsing)
Definite Clause Grammar (DCG)
Augmenting a Grammar
Semantic Interpretation
Ambiguity and Disambiguation
A Communicating Agent
3. Lời mở đầu
Chúng ta sẽ tìm hiểu lý do tại sao các đại lý cần
trao đổi thông tin mang thông điệp với nhau, và làm
thế nào chúng có thể làm như vậy
Ví dụ :Trong một buổi hoàng hôn trong khu
rừng của vườn quốc gia Amboseli gần cơ sở của
Kilimanjaro. Một nhóm các con khỉ thuộc loài vervet
đang tìm kiếm thức ăn. Một con khỉ nhìn thấy con báo
trong bụi rậm đã liên lạc với nhóm bằng cách kêu to
và cả nhóm phản ứng bằng cách đu nhanh qua những
cành cây để tránh con báo đang ẩn trong bụi rậm . Ở
đây chú khỉ Vervet đã thành công liên lạc với nhóm
4. - Giao tiếp tuy là một hiện tượng phổ
biến mà nhưng rất khó có thể định nghĩa một cách
chính xác. Nhìn chung, giao tiếp là việc trao
đổi thông tin mang lại sự trình bày và nhận
thức của dấu hiệu rút ra từ một hệ
thống chia sẻ của các ký hiệu thông thường
- Hầu hết các loài động vật sử dụng một tập cố
định các dấu hiệu để đại diện cho các
tin nhắn quan trọng cho sự sống còn của nó
5. Communication as Action
Một trong những hành động có sẵn của một Agent là để
tạo ra ngôn ngữ.
Ví dụ : Hãy tưởng tượng một nhóm Agents sẽ cùng chơi
trò wumpus với nhau.Có thể làm như sau:
- Thông báo cho nhau về các phần của bản đồ
đã khám phá mà mỗi Agents đã làm, điều này được
thực hiện bằng cách lập báo cáo. Truy vấn các đại
lý khác về các khía cạnh cụ thể của bản đồ, điều
này thường được thực hiện bằng cách đặt câu hỏi:
- Bạn đã thấy Wumpus ở đâu không?Trả lời câu
hỏi. Đây là một loại thông báo. Có, tôi thấy Wumpus ở
vị trí 2 5. Khi đó Agents khác nhận được thông tin như
thế, nó sẽ quay trở lại để bắt đầu và đi ra hướng khác
6. Sự phát triển của ngôn ngữ
Năm1866, Societe de Linguistique de Paris đã thông
qua một đạo luật cấm mọi tranh cãi về nguồn gốc của
ngôn ngữ. Bên ngoài hội nghị đó cuộc tranh cãi lại vẫn
tiếp tục
Có bằng chứng cho rằng việc sử
dụng ngôn ngữ có thể được thực hiện bởi các kỹ năng
khác nhau mà không phụ thuộc vào khả năng nhận
thức nói chung, và nhiều người trong số các nhà khoa
học sử dụng ngôn ngữ của con người có thể được nhìn
thấy trong các loài linh trưởng khác và trong các hóa
thạch.
7. ◦ Ít nhất bảy nhà nghiên cứu khẳng định đã dạy loài
linh trưởng trên 100 từ. Chúng có thể
hiểu các câu liên quan đến khái niệm trừu tượng một
cách hạn chế, chẳng hạn như đề cập
đến đối tượng mà không thể hiện ra.
◦ Ví dụ, loài tinh tinh có thể phản ứng một cách
chính xác với mệnh lệnh đưa quả bóng ra
ngoài hoặc mang lại cho chúng ta
quả bóng màu đỏ hoặc quả bóng màu xanh,
chúng thậm chí có thể nói dối
8. Vấn đề cơ bản của ngôn ngữ
Mặc dù chúng ta chủ yếu quan tâm đến ngôn
ngữ tự nhiên, tuy nhiên chúng ta sẽ xây dựng cho
việc sử dụng tất cả các công cụ của lý thuyết của
ngôn ngữ hình thức, bắt đầu với ký hiệu hình thức
Backus-Naur (BNF).
Một ngôn ngữchính thức được định nghĩa là một
tập hợp các chuỗi, mỗi chuỗi là một dãy các ký
hiệu lấy từ một tập hợp hữu hạn được gọi là các ký
hiệu đầu cuối. Đối với tiếng Anh,các ký hiệu đầu
cuối bao gồm các từ như , aback, abacus, và
khoảng 400.000 từ khác
9. CÁC BƯỚC THÀNH PHẦN CỦA GIAO TiẾP
Một tập giao tiếp điển hình, trong đó người nói S muốn
truyền đạt đề nghị P tới người nghe H sử dụng từ W, bao
gồm bảy quá trình.
Ba vị trí đưa ra trong người nói:
◦ Dự định: S muốn H tin P
◦ Sự phát sinh: S chọn từ W
◦ Tổng hợp: S phát ra từ W
Bốn đưa ra trong người nghe:
◦ Nhận thức: H nhận thức W
◦ Phân tích: H suy luận W có ý nghĩa có thể là P1, ..., Pn
◦ Định hướng: H suy luận rằng S có ý định truyền đạt Pi
◦ Kết hợp: H quyết định để tin rằng Pi
10. KHẢ NĂNG SINH
Hình thức ngữ pháp có thể được phân loại theo khả năng năng
sinh ra của nó. Chomsky (1957) mô tả bốn lớp học của hình
thức ngữ pháp chỉ khác nhau ở hình thức viết lại quy tắc:
◦ Đệ quy đếm ngược
◦ Ngữ pháp theo ngữ cảnh
◦ Ngữ pháp phi ngữ cảnh
◦ Thường lề
12. Ví dụ về giao tiếp
Dự định: Người nói có ý định cho người nghe biết rằng
Wumpus không còn sống lâu hơn nữa.
Phát sinh: Người nói sử dụng kiến thức về ngôn ngữ để
quyết định những gì nói.
Tổng hợp: Hầu hết các hệ thống ngôn ngữ cơ bản AI
tổng hợp kiểu xuất ra trên một màn hình hoặc giấy tờ,
chúng ta thấy các agent tổng hợp một chuỗi âm thanh
bằng văn bản trong bảng chữ cái ngữ âm được định
nghĩa trước
13. Ví dụ về giao tiếp
Nhận thức: Tại đây người nghe tiến hành nhận dạng
thông tin được xuất ra từ người nói (nhận dạng giọng nói
hoặc nhận dạng ký tự quang học: đây là hai cách phổ
biến cho tới thời điểm này).
Phân tích: Chia ra phân tích thành hai phần chính:
◦ Giải thích cú pháp (hoặc phân tích cú pháp): Đề cập
đến tiến trình của một phần của lời nói (danh từ, động
từ … ) cho mỗi từ trong một câu và nhóm các từ thành
các cụm từ.
◦ Giải thích ngữ nghĩa: là quá trình lấy ra ý nghĩa tương
tự của một lời nói như một biểu thức trong một số
ngôn ngữ đại diện. Nó bao gồm cả giải thích thực tế (
là một phần giải thích ngữ nghĩa nó đưa tình hình hiện
tại tới người dùng)
14. Ví dụ về giao tiếp
Định hướng: hầu hết người nói không cố ý tạo nên sự
mơ hồ, nhưng hầu hết các lời phát biểu có nhiều cách
hiểu khác nhau. Công việc của người nghe lúc này là tìm
ra và giải thích một ý nghĩa của nội dung truyền đạt mà
người nói cung cấp
Kết hợp: một Agent ngây thơ hoàn toàn có thể tin tất cả
mọi thứ nó nghe, nhưng một agent tinh vi xử lý từ W và
giải thích nguồn gốc từ Pi như là phần bổ sung, xem xét
cùng với tất cả các bằng chứng khác để cho Pi hợp lý.
15. HAI MÔ HÌNH GIAO TiẾP
Mã hóa thông điệp: Mô hình tin nhắn mã hóa cho
biết rằng người nói có một đề xuất P xác định
trong tâm trí, và mã hóa các đề xuất vào các từ
(hoặc có dấu hiệu) W. người nghe sau đó cố gắng
để giải mã các tin nhắn W để lấy các đề xuất ban
đầu P (gọi là mã Morse).
Ngôn ngữ hoàn cảnh: ý nghĩa của một thông điệp
phụ thuộc vào cả hai là từ và tình hình trong đó các
từ được thốt ra. Việc tính toán trong thực tế cho
thấy rằng rằng các từ tương tự có thể có ý nghĩa
rất khác nhau trong các tình huống khác nhau.
◦ Thất bại trong khi sử dụng mô hình ngôn ngữ
hoàn cảnh: nếu người nói và người nghe có
những suy nghĩ khác nhau về cùng một tình hình
hiện tại, thì sau đó tin nhắn không thể có được
thông qua như dự định
16. Văn phạm chính quy cho tập con tiếng anh
Định nghĩa
Ký hiệu
Sự khác biệt với ngôn ngữ tự nhiên
Từ vựng của ngôn ngữ
Văn phạm của ngôn ngữ
17. Định nghĩa
Một văn phạm chính quy cho tập con của tiếng
anh là thích hợp để tạo các câu lệnh trong thế
giới wumpus – Ngôn ngữ
Văn phạm xử lý
ngôn ngữ tự nhiên
18. Ký hiệu
Tập chữ cái hoặc âm thanh kết hợp thành tập từ
cố định
Chuẩn hóa thành xâu đơn giản
◦ Ví dụ: This is a sentence
19. Sự khác biệt với ngôn ngữ tự nhiên
Khó để mô tả ngôn ngữ tự nhiên thành tập các
xâu:
◦ Người nói không theo nguyên tắc
◦ Ngôn ngữ thay đổi theo thời gian
◦ Phát biểu không văn phạm
◦ Nghĩa nhập nhằng
22. Phân tích cú pháp
o Có nhiều thuật toán phân tích cú pháp – khôi phục cấu trúc
cụm từ của lời nói, đưa ra ngữ pháp
o Một số hoạt động theo quy tắc từ trên
o Một số sử dụng phương pháp kết hợp giữa phương pháp từ
trên xuống và từ dưới lên
o Sử dụng một số kĩ thuật lập trình năng động để trách những
yếu điểm của việc quay lui.
25. Overview
Communication as Action
Types of Communicating Agents
A Formal Grammar for a Subset of English
Syntactic Analysis (Parsing)
Definite Clause Grammar (DCG)
Augmenting a Grammar
Semantic Interpretation
Ambiguity and Disambiguity
A Communicating Agent
26. Definite Clause Grammer (DCG)
Problems with Backus-Naur Form (BNF)
◦ Need meaning
◦ Context sensitive
Introduction of First Order Logic
BNF First Order Logic
S ® NP VP NP(s1) / VP(s2) Þ S(Append(s1 ,s2))
Noun ® stench | … (s=“stench” / …) Þ Noun(s)
27. DCG Notation
Positive:
◦ Easy to describe grammars
Negative:
◦ More verbose than BNF
3 Rules:
•The notation X ® Y Z … translate as Y(s1) / Z(s2)…Þ X(Append(s1, s2,…).
•The notation X ® word translates as X([“word”]).
•The notation X ® Y | Z | … translates as Y‟(s) / Z‟(s) /…Þ X(s), where Y‟
is the translation into logic of the DCG expression Y.
28. Extending the Notation
Non-terminal symbols can be augmented
A variable can appear on RHS
An arbitrary logical test can appear on RHS
DCG First Order Logic
Digit(sem) sem { 0 sem 9 } (s=[sem]) Digit(sem , s)
Number(sem) Digit(sem) Digit(sem , s) Number(sem , s)
Number(sem) Number(sem1) Digit(sem2) Number(sem , s1) / Digit(sem , s2) /
{sem = 10 sem1 + sem2} sem = 10 sem1 + sem2
Number(sem , Append(s1 , s2)
29. Overview
Communication as Action
Types of Communicating Agents
A Formal Grammar for a Subset of English
Syntactic Analysis (Parsing)
Definite Clause Grammar (DCG)
Augmenting a Grammar
Semantic Interpretation
Ambiguity and Disambiguity
A Communicating Agent
30. Overgeneration
Simple grammar can overgenerate
◦ Ex: “Me smells a stench.”
To fix we must understand
Cases of English
◦ Nominative - subjective - “I”
◦ Accusative - objective - “me”
31. New Rules
Changes needed to handle subjective and objective cases
S NPs VP | …
NPs Pronouns | Noun | Article Noun
Npo Pronouno | Noun | Article Noun
VP VP NPo | …
PP Preposition NPo
Pronouns I | you | he | she | …
Pronouno me | you | him | her | …
Use of Augmentation
S NP(subjective) VP | …
NP(case) Pronoun(case) | Noun | Article Noun
VP VP NP(Objective) | …
PP Preposition NP(Objective)
Pronoun(Subjective) I | you | he | she | …
Pronoun(Objective) me | you | him | her | …
32. Verb Subcategorization
Now have slight improvement
Must create a sub-categorization list
Verb Subcats Example
give [NP , PP] give the gold in 3,3 to me
[NP , NP] give me the gold
smell [NP] smell a wumpus
[Adjective] smell awful
[PP] smell like a wumpus
is [Adjective] Is smelly
[PP] is in 2 2
[NP] is a pit
believe [S] Believe the smelly wumpus in 2 2 is dead
33. Parse Tree
S
VP([])
NP VP([NP])
VP([NP,NP]) NP NP
Pronoun Verb([NP,NP]) Pronoun Article Noun
You give me the gold
34. 22.7 SEMANTIC INTERPRETATION
- "X + Y" in arithmetic or X A Y in logic they have a compositional
semantics. we know the meaning of X and Y (and +), then we
know the meaning of the whole phrase.
- "The batter hit the ball“ and "The chef mixed the batter to be
served at the ball“; we expect the two words to have different
meanings.
Semantic interpretation alone cannot be certain of the right
interpretation of a phrase or sentence
35. Semantics as DCG Augmentations
Arithmetic “3 + (4 - 2)” is analyzed as Exp(5), an
expression whose semantic interpretation is 5.
36. The semantics of "John loves Mary"
We will look at the simple sentence "John loves
Mary" and associate with it the semantic
interpretation Loves(John,Mary).
37. We end up with the grammar shown in Figure 22.15 and the
parse tree shown in Figure 22.16.
38. The semantics of £1
"Every agent smells a wumpus" can be expressed as:
Our task is to build up our desired representation from the
constituents of the sentence. We first break the sentence into NP
and VP phrases, to which we can assign the following semantics:
39. The semantics of £1 (cont…)
Right away there are two problems.
First, the semantics of the entire sentence appears to be the
semantics of the NP with the semantics of the VP filling in the
... part
The second problem is that we need to get the variable a as
an argument to the relation Perceive.
40. The semantics of £1 (cont…)
To avoid this confusion, many modern grammars take a different
tack. They define an intermediate form to mediate between
syntax and semantics.
Because it sits between the syntactic and logical forms, it is
sometimes called a quasi-logical form.8
we will use a quasi-logical form that includes all of first-order
logic and is augmented by lambda expressions and one new
construction, which we will call a quantified term.
41. The semantics of £1 (cont…)
It can be difficult to write a complex grammar that always comes
up with the right semantic interpretation, and everyone has their
own way of attacking the problem. We suggest a methodology
based on 8 steps:
1. Decide on the logical or quasi-logical form you want to generate
2. Make one-word-at-a-time modifications to your example
sentences, and study the corresponding logical forms.
3. Eventually you should be able to write down the basic logical
type of each lexical category (noun, verb, and so on), along with
some word/logical form pairs.
4. Now consider phrase-at-a-time modifications to your example
sentences (e.g., substituting "every stinking wumpus" for "I").
42. The semantics of £1 (cont…)
5. Once you know the type of each category, it is not too hard to
attach semantic interpretation augmentations to the grammar
rules.
6. Other times, the right-hand side of a rule will contain a semantic
interpretation that is a predicate (or function), and one or more
that are objects.
7. Sometimes the semantics is built up by concatenating the
semantics of the constituents, possibly with some connectors
wrapped around them
8. Finally, sometimes you need to take apart one of the
constituents before putting the semantics of the whole phrase
back together.
46. Bài tập trí tuệ nhân tạo
Chuyển đổi dạng gần logic sang dạng logic
(Convert quasi-logical form to logical form)
Giải thích thực tế (Pragmatic Interpretation)
47. Quy tắc chuyển đổi dạng bán logic sang dạng
logic
Thay thế thuật ngữ định lượng với x
QLF thay bằng qx P(x) op QLF
op là => khi q là V và
op là A khi q là 3 (tồn tại) hoặc 3! (không tồn tại)
48. Ví dụ chuyển đổi dạng gần logic sang dạng logic
“Every dog has a day”
Ví dụ này không chỉ rõ lượng từ nào được biểu
diễn trước vì vậy ta sẽ có 2 cách biểu diễn sau:
49. Giải thích thực tiễn
indexicals là cụm từ đề cập trực tiếp đến tình
trạng hiện tại, làm rõ nghĩa của indexicals là một
yêu cầu cần thiết trong giải thích thực tiễn
"I am in Boston today“
indexicals "I" and "today" phụ thuộc vào người nói
và thời điểm nói
Phép trùng lặp (anaphora): sự xuất hiện của các
cụm từ tham chiếu tới đối tượng được nêu trước
đó
50. Giải thích thực tiễn (tiếp)
"He saw him in the mirror" có 2 đại từ he và hiem phải
tham chiếu tới 2 người khác nhau.
"He saw himself", đại từ he và himself cùng chỉ 1 người.
Không có quy định bắt buộc nào về tham chiếu của sự
trùng lặp vì vậy quyết định tham chiếu là một phần của
giải quyết nhập nhằng, mặc dù giải quyết nhập nhằng
chắc chắn phụ thuộc vào các thông tin, ngữ cảnh thực tế
của thông tin.
51. Ambiguity
Hiểu lầm trong giao tiếp
Nhập nhằng
◦ Từ vựng
◦ Cú pháp
◦ Ngữ nghĩa
◦ ….
4/1/2012 51
53. Lexical Ambiguity
Một từ có thể thuộc nhiều từ loại trong
các ngữ cảnh khác nhau
“back”
4/1/2012 53
54. Syntactic Ambiguity
Có thể xuất hiện cùng Lexical Ambiguity
Nhiều cây phân tích cú pháp
PP attachment
◦ “Tôi nhìn thấy cô ấy với cái kính”
4/1/2012 54
55. Semantic Ambiguity
Có thể xuất hiện bởi
Referential ambiguity
◦ “it”, “those”, „which‟…
Syntactic và Semantic Ambiguity
◦ “S1 and S2 and S3”
4/1/2012 55
56. Local ambiguity
Xem xét đến ngữ nghĩa của ngữ cảnh lớn
hơn của toàn bộ câu hay đoạn văn
◦ char * c; 2*c
4/1/2012 56
57. Disambiguation
Loại bỏ nhập nhằng
Cố gắng đưa ra câu có ngữ nghĩa đúng
nhất với văn cảnh
4/1/2012 57
58. Four model
The world model
The mental model
The language model
The acoustic model
4/1/2012 58
59. PCFG
P(tree) = Tích số của P(rules)
◦ S → NP VP (0.9)
◦ S → S Conjunction S (0.1)
4/1/2012 59
60. PCFG
Mỗi luật có xác suất
Các luật được đánh giá có trọng số
Mội số luật hay sử dụng thì được ưu tiên
hơn các luật ít sử dụng
Chọn cây phân tích cú pháp nào có xác
suất lớn nhất
4/1/2012 60
61. Communicating Agents
Ứng dụng các kĩ thuật NLP
Mở rộng ngữ pháp để nhận biết các mệnh
lệnh
4/1/2012 61
62. Các luật cho mệnh lệnh
các luật cho một mệnh lệnh:
◦ S(Command(rel(Hearer)) → VP(rel)
◦ S(Command(rel(obj)) → NP(obj) VP(rel)
Diễn giải logic (quasi-logical)
◦ Command(Зe e €Go(Hearer,[2,2]))
4/1/2012 62
63. Các luật cho sự tiếp nhận
S(Acknowledge(sem)) → Ack(sem)
Ack(True) → yes
Ack(True) → OK
Ack(False) → no
4/1/2012 63
64. Tổng kết
Các vấn đề về xử lý ngôn ngữ tự nhiên
Các vấn đề trong việc xây dựng tác tử hội
thoại
Làm thế nào để tác tử hiểu được ngôn ngữ
tự nhiên
4/1/2012 64
65. Khó khăn
Mục đích của lời thoại bằng tín hiệu là thực
Ngôn ngữ của loài người phức tạp
Lý thuyết văn phạm và ngôn ngữ còn giới hạn
Ảnh hưởng của văn phong, cách nói trong ngữ
cảnh
4/1/2012 65