SlideShare une entreprise Scribd logo
1  sur  1
Télécharger pour lire hors ligne
Let us assume the basic definition of self-attention (without any weight matrices), where all the
queries, keys, and values are the data points themselves (i.e., xi = qi = ki = vi). We will see how
self-attention lets the network select different parts of the data to be the content (value) and other
parts to determine where to pay attention (queries and keys). Consider 4 orthogonal base vectors
all of equal `2 norm a, b, c, d. (Suppose that their norm is , which is some very, very large
number.) Out of these base vectors, construct 3 tokens:
x1 = d + b,
x2 = a,
x3 = c + b.
a. What are the norms of x1, x2, x3?
b. Compute (y1, y2, y3) = Self-attention(x1, x2, x3). Identify which tokens (or combinations of
tokens) are approximated by the outputs y1, y2, y3.
c. Using the above example, describe in a couple of sentences how self-attention that allows
networks to copy an input value to the output.

Contenu connexe

Similaire à Let us assume the basic definition of self-attention (without any we.pdf

Unit-1 Introduction and Mathematical Preliminaries.pptx
Unit-1 Introduction and Mathematical Preliminaries.pptxUnit-1 Introduction and Mathematical Preliminaries.pptx
Unit-1 Introduction and Mathematical Preliminaries.pptx
avinashBajpayee1
 
CVPR2009 tutorial: Kernel Methods in Computer Vision: part I: Introduction to...
CVPR2009 tutorial: Kernel Methods in Computer Vision: part I: Introduction to...CVPR2009 tutorial: Kernel Methods in Computer Vision: part I: Introduction to...
CVPR2009 tutorial: Kernel Methods in Computer Vision: part I: Introduction to...
zukun
 
1) IntroductionThis practical work consists of developing
1) IntroductionThis practical work consists of developing1) IntroductionThis practical work consists of developing
1) IntroductionThis practical work consists of developing
AbbyWhyte974
 
1) IntroductionThis practical work consists of developing
1) IntroductionThis practical work consists of developing1) IntroductionThis practical work consists of developing
1) IntroductionThis practical work consists of developing
MartineMccracken314
 
Vectors Intro.ppt
Vectors Intro.pptVectors Intro.ppt
Vectors Intro.ppt
puneet680917
 

Similaire à Let us assume the basic definition of self-attention (without any we.pdf (20)

Arrays and library functions
Arrays and library functionsArrays and library functions
Arrays and library functions
 
Bigdata analytics
Bigdata analyticsBigdata analytics
Bigdata analytics
 
Support Vector Machine.ppt
Support Vector Machine.pptSupport Vector Machine.ppt
Support Vector Machine.ppt
 
svm.ppt
svm.pptsvm.ppt
svm.ppt
 
support vector machine algorithm in machine learning
support vector machine algorithm in machine learningsupport vector machine algorithm in machine learning
support vector machine algorithm in machine learning
 
Lect4
Lect4Lect4
Lect4
 
Unit-1 Introduction and Mathematical Preliminaries.pptx
Unit-1 Introduction and Mathematical Preliminaries.pptxUnit-1 Introduction and Mathematical Preliminaries.pptx
Unit-1 Introduction and Mathematical Preliminaries.pptx
 
lecture14-SVMs (1).ppt
lecture14-SVMs (1).pptlecture14-SVMs (1).ppt
lecture14-SVMs (1).ppt
 
20MEMECH Part 3- Classification.pdf
20MEMECH Part 3- Classification.pdf20MEMECH Part 3- Classification.pdf
20MEMECH Part 3- Classification.pdf
 
III_Data Structure_Module_1.ppt
III_Data Structure_Module_1.pptIII_Data Structure_Module_1.ppt
III_Data Structure_Module_1.ppt
 
Multiclass Logistic Regression: Derivation and Apache Spark Examples
Multiclass Logistic Regression: Derivation and Apache Spark ExamplesMulticlass Logistic Regression: Derivation and Apache Spark Examples
Multiclass Logistic Regression: Derivation and Apache Spark Examples
 
AI Final report 1.pdf
AI Final report 1.pdfAI Final report 1.pdf
AI Final report 1.pdf
 
CVPR2009 tutorial: Kernel Methods in Computer Vision: part I: Introduction to...
CVPR2009 tutorial: Kernel Methods in Computer Vision: part I: Introduction to...CVPR2009 tutorial: Kernel Methods in Computer Vision: part I: Introduction to...
CVPR2009 tutorial: Kernel Methods in Computer Vision: part I: Introduction to...
 
III_Data Structure_Module_1.pptx
III_Data Structure_Module_1.pptxIII_Data Structure_Module_1.pptx
III_Data Structure_Module_1.pptx
 
Presentation on Text Classification
Presentation on Text ClassificationPresentation on Text Classification
Presentation on Text Classification
 
1) IntroductionThis practical work consists of developing
1) IntroductionThis practical work consists of developing1) IntroductionThis practical work consists of developing
1) IntroductionThis practical work consists of developing
 
1) IntroductionThis practical work consists of developing
1) IntroductionThis practical work consists of developing1) IntroductionThis practical work consists of developing
1) IntroductionThis practical work consists of developing
 
Identifiers, keywords and types
Identifiers, keywords and typesIdentifiers, keywords and types
Identifiers, keywords and types
 
Transcending our views to sequential data
Transcending our views to sequential data Transcending our views to sequential data
Transcending our views to sequential data
 
Vectors Intro.ppt
Vectors Intro.pptVectors Intro.ppt
Vectors Intro.ppt
 

Plus de balrajashok

Los estudios de casos de gesti�n de proyectos se basan en el PMI 201.pdf
Los estudios de casos de gesti�n de proyectos se basan en el PMI 201.pdfLos estudios de casos de gesti�n de proyectos se basan en el PMI 201.pdf
Los estudios de casos de gesti�n de proyectos se basan en el PMI 201.pdf
balrajashok
 
Los empleados primero�. Ese es el valor cultural m�s importante y cr.pdf
Los empleados primero�. Ese es el valor cultural m�s importante y cr.pdfLos empleados primero�. Ese es el valor cultural m�s importante y cr.pdf
Los empleados primero�. Ese es el valor cultural m�s importante y cr.pdf
balrajashok
 

Plus de balrajashok (20)

Los procedimientos anal�ticos son procedimientos sustantivos que pue.pdf
Los procedimientos anal�ticos son procedimientos sustantivos que pue.pdfLos procedimientos anal�ticos son procedimientos sustantivos que pue.pdf
Los procedimientos anal�ticos son procedimientos sustantivos que pue.pdf
 
Los plurales de algunos t�rminos m�dicos pueden ser dif�ciles de con.pdf
Los plurales de algunos t�rminos m�dicos pueden ser dif�ciles de con.pdfLos plurales de algunos t�rminos m�dicos pueden ser dif�ciles de con.pdf
Los plurales de algunos t�rminos m�dicos pueden ser dif�ciles de con.pdf
 
Los miembros deben usar el marco conceptual AICPA para la independen.pdf
Los miembros deben usar el marco conceptual AICPA para la independen.pdfLos miembros deben usar el marco conceptual AICPA para la independen.pdf
Los miembros deben usar el marco conceptual AICPA para la independen.pdf
 
Los patrones caracter�sticos del ciclo econ�mico de valle, expansi�n.pdf
Los patrones caracter�sticos del ciclo econ�mico de valle, expansi�n.pdfLos patrones caracter�sticos del ciclo econ�mico de valle, expansi�n.pdf
Los patrones caracter�sticos del ciclo econ�mico de valle, expansi�n.pdf
 
Los pa�ses de bajos ingresos tienen un INB per c�pita de $1,005 o me.pdf
Los pa�ses de bajos ingresos tienen un INB per c�pita de $1,005 o me.pdfLos pa�ses de bajos ingresos tienen un INB per c�pita de $1,005 o me.pdf
Los pa�ses de bajos ingresos tienen un INB per c�pita de $1,005 o me.pdf
 
Los museos p�blicos a veces piden a los patrocinadores que donen una.pdf
Los museos p�blicos a veces piden a los patrocinadores que donen una.pdfLos museos p�blicos a veces piden a los patrocinadores que donen una.pdf
Los museos p�blicos a veces piden a los patrocinadores que donen una.pdf
 
Los loci A y B tienen una frecuencia de recombinaci�n del 5 por cien.pdf
Los loci A y B tienen una frecuencia de recombinaci�n del 5 por cien.pdfLos loci A y B tienen una frecuencia de recombinaci�n del 5 por cien.pdf
Los loci A y B tienen una frecuencia de recombinaci�n del 5 por cien.pdf
 
Los mercados sociales act�an como ______________ en l�nea aprovechan.pdf
Los mercados sociales act�an como ______________ en l�nea aprovechan.pdfLos mercados sociales act�an como ______________ en l�nea aprovechan.pdf
Los mercados sociales act�an como ______________ en l�nea aprovechan.pdf
 
Los ingresos de una entidad normalmente se miden por los valores de .pdf
Los ingresos de una entidad normalmente se miden por los valores de .pdfLos ingresos de una entidad normalmente se miden por los valores de .pdf
Los ingresos de una entidad normalmente se miden por los valores de .pdf
 
Los impuestos a la propiedad sobre las instalaciones de fabricaci�n .pdf
Los impuestos a la propiedad sobre las instalaciones de fabricaci�n .pdfLos impuestos a la propiedad sobre las instalaciones de fabricaci�n .pdf
Los impuestos a la propiedad sobre las instalaciones de fabricaci�n .pdf
 
Los hombres tienen m�s probabilidades de sufrir una enfermedad o tra.pdf
Los hombres tienen m�s probabilidades de sufrir una enfermedad o tra.pdfLos hombres tienen m�s probabilidades de sufrir una enfermedad o tra.pdf
Los hombres tienen m�s probabilidades de sufrir una enfermedad o tra.pdf
 
Los helechos, un tipo de planta, pasan por una alternancia de genera.pdf
Los helechos, un tipo de planta, pasan por una alternancia de genera.pdfLos helechos, un tipo de planta, pasan por una alternancia de genera.pdf
Los helechos, un tipo de planta, pasan por una alternancia de genera.pdf
 
Los ganglios linf�ticos funcionan como puntos de encuentro entre las.pdf
Los ganglios linf�ticos funcionan como puntos de encuentro entre las.pdfLos ganglios linf�ticos funcionan como puntos de encuentro entre las.pdf
Los ganglios linf�ticos funcionan como puntos de encuentro entre las.pdf
 
Los estudios de casos de gesti�n de proyectos se basan en el PMI 201.pdf
Los estudios de casos de gesti�n de proyectos se basan en el PMI 201.pdfLos estudios de casos de gesti�n de proyectos se basan en el PMI 201.pdf
Los estudios de casos de gesti�n de proyectos se basan en el PMI 201.pdf
 
Los estados financieros de todo el gobierno benefician a los usuar.pdf
Los estados financieros de todo el gobierno benefician a los usuar.pdfLos estados financieros de todo el gobierno benefician a los usuar.pdf
Los estados financieros de todo el gobierno benefician a los usuar.pdf
 
Los especialistas en marketing incorporan mensajes encubiertos en an.pdf
Los especialistas en marketing incorporan mensajes encubiertos en an.pdfLos especialistas en marketing incorporan mensajes encubiertos en an.pdf
Los especialistas en marketing incorporan mensajes encubiertos en an.pdf
 
Los estados financieros de Rukavina Corporation son los siguientes .pdf
Los estados financieros de Rukavina Corporation son los siguientes .pdfLos estados financieros de Rukavina Corporation son los siguientes .pdf
Los estados financieros de Rukavina Corporation son los siguientes .pdf
 
Los elementos de la agencia aparente son A confianza en la repre.pdf
Los elementos de la agencia aparente son A confianza en la repre.pdfLos elementos de la agencia aparente son A confianza en la repre.pdf
Los elementos de la agencia aparente son A confianza en la repre.pdf
 
Los empleados primero�. Ese es el valor cultural m�s importante y cr.pdf
Los empleados primero�. Ese es el valor cultural m�s importante y cr.pdfLos empleados primero�. Ese es el valor cultural m�s importante y cr.pdf
Los empleados primero�. Ese es el valor cultural m�s importante y cr.pdf
 
Los enfoques de Teaming que se usan en los grupos de LinkedIn normal.pdf
Los enfoques de Teaming que se usan en los grupos de LinkedIn normal.pdfLos enfoques de Teaming que se usan en los grupos de LinkedIn normal.pdf
Los enfoques de Teaming que se usan en los grupos de LinkedIn normal.pdf
 

Dernier

Spellings Wk 3 English CAPS CARES Please Practise
Spellings Wk 3 English CAPS CARES Please PractiseSpellings Wk 3 English CAPS CARES Please Practise
Spellings Wk 3 English CAPS CARES Please Practise
AnaAcapella
 
Activity 01 - Artificial Culture (1).pdf
Activity 01 - Artificial Culture (1).pdfActivity 01 - Artificial Culture (1).pdf
Activity 01 - Artificial Culture (1).pdf
ciinovamais
 
Jual Obat Aborsi Hongkong ( Asli No.1 ) 085657271886 Obat Penggugur Kandungan...
Jual Obat Aborsi Hongkong ( Asli No.1 ) 085657271886 Obat Penggugur Kandungan...Jual Obat Aborsi Hongkong ( Asli No.1 ) 085657271886 Obat Penggugur Kandungan...
Jual Obat Aborsi Hongkong ( Asli No.1 ) 085657271886 Obat Penggugur Kandungan...
ZurliaSoop
 

Dernier (20)

TỔNG ÔN TẬP THI VÀO LỚP 10 MÔN TIẾNG ANH NĂM HỌC 2023 - 2024 CÓ ĐÁP ÁN (NGỮ Â...
TỔNG ÔN TẬP THI VÀO LỚP 10 MÔN TIẾNG ANH NĂM HỌC 2023 - 2024 CÓ ĐÁP ÁN (NGỮ Â...TỔNG ÔN TẬP THI VÀO LỚP 10 MÔN TIẾNG ANH NĂM HỌC 2023 - 2024 CÓ ĐÁP ÁN (NGỮ Â...
TỔNG ÔN TẬP THI VÀO LỚP 10 MÔN TIẾNG ANH NĂM HỌC 2023 - 2024 CÓ ĐÁP ÁN (NGỮ Â...
 
Key note speaker Neum_Admir Softic_ENG.pdf
Key note speaker Neum_Admir Softic_ENG.pdfKey note speaker Neum_Admir Softic_ENG.pdf
Key note speaker Neum_Admir Softic_ENG.pdf
 
Spellings Wk 3 English CAPS CARES Please Practise
Spellings Wk 3 English CAPS CARES Please PractiseSpellings Wk 3 English CAPS CARES Please Practise
Spellings Wk 3 English CAPS CARES Please Practise
 
Basic Civil Engineering first year Notes- Chapter 4 Building.pptx
Basic Civil Engineering first year Notes- Chapter 4 Building.pptxBasic Civil Engineering first year Notes- Chapter 4 Building.pptx
Basic Civil Engineering first year Notes- Chapter 4 Building.pptx
 
psychiatric nursing HISTORY COLLECTION .docx
psychiatric  nursing HISTORY  COLLECTION  .docxpsychiatric  nursing HISTORY  COLLECTION  .docx
psychiatric nursing HISTORY COLLECTION .docx
 
Unit-IV; Professional Sales Representative (PSR).pptx
Unit-IV; Professional Sales Representative (PSR).pptxUnit-IV; Professional Sales Representative (PSR).pptx
Unit-IV; Professional Sales Representative (PSR).pptx
 
Kodo Millet PPT made by Ghanshyam bairwa college of Agriculture kumher bhara...
Kodo Millet  PPT made by Ghanshyam bairwa college of Agriculture kumher bhara...Kodo Millet  PPT made by Ghanshyam bairwa college of Agriculture kumher bhara...
Kodo Millet PPT made by Ghanshyam bairwa college of Agriculture kumher bhara...
 
2024-NATIONAL-LEARNING-CAMP-AND-OTHER.pptx
2024-NATIONAL-LEARNING-CAMP-AND-OTHER.pptx2024-NATIONAL-LEARNING-CAMP-AND-OTHER.pptx
2024-NATIONAL-LEARNING-CAMP-AND-OTHER.pptx
 
Activity 01 - Artificial Culture (1).pdf
Activity 01 - Artificial Culture (1).pdfActivity 01 - Artificial Culture (1).pdf
Activity 01 - Artificial Culture (1).pdf
 
How to Give a Domain for a Field in Odoo 17
How to Give a Domain for a Field in Odoo 17How to Give a Domain for a Field in Odoo 17
How to Give a Domain for a Field in Odoo 17
 
Jual Obat Aborsi Hongkong ( Asli No.1 ) 085657271886 Obat Penggugur Kandungan...
Jual Obat Aborsi Hongkong ( Asli No.1 ) 085657271886 Obat Penggugur Kandungan...Jual Obat Aborsi Hongkong ( Asli No.1 ) 085657271886 Obat Penggugur Kandungan...
Jual Obat Aborsi Hongkong ( Asli No.1 ) 085657271886 Obat Penggugur Kandungan...
 
UGC NET Paper 1 Mathematical Reasoning & Aptitude.pdf
UGC NET Paper 1 Mathematical Reasoning & Aptitude.pdfUGC NET Paper 1 Mathematical Reasoning & Aptitude.pdf
UGC NET Paper 1 Mathematical Reasoning & Aptitude.pdf
 
Accessible Digital Futures project (20/03/2024)
Accessible Digital Futures project (20/03/2024)Accessible Digital Futures project (20/03/2024)
Accessible Digital Futures project (20/03/2024)
 
Spatium Project Simulation student brief
Spatium Project Simulation student briefSpatium Project Simulation student brief
Spatium Project Simulation student brief
 
Magic bus Group work1and 2 (Team 3).pptx
Magic bus Group work1and 2 (Team 3).pptxMagic bus Group work1and 2 (Team 3).pptx
Magic bus Group work1and 2 (Team 3).pptx
 
Understanding Accommodations and Modifications
Understanding  Accommodations and ModificationsUnderstanding  Accommodations and Modifications
Understanding Accommodations and Modifications
 
On National Teacher Day, meet the 2024-25 Kenan Fellows
On National Teacher Day, meet the 2024-25 Kenan FellowsOn National Teacher Day, meet the 2024-25 Kenan Fellows
On National Teacher Day, meet the 2024-25 Kenan Fellows
 
How to Create and Manage Wizard in Odoo 17
How to Create and Manage Wizard in Odoo 17How to Create and Manage Wizard in Odoo 17
How to Create and Manage Wizard in Odoo 17
 
Asian American Pacific Islander Month DDSD 2024.pptx
Asian American Pacific Islander Month DDSD 2024.pptxAsian American Pacific Islander Month DDSD 2024.pptx
Asian American Pacific Islander Month DDSD 2024.pptx
 
ICT role in 21st century education and it's challenges.
ICT role in 21st century education and it's challenges.ICT role in 21st century education and it's challenges.
ICT role in 21st century education and it's challenges.
 

Let us assume the basic definition of self-attention (without any we.pdf

  • 1. Let us assume the basic definition of self-attention (without any weight matrices), where all the queries, keys, and values are the data points themselves (i.e., xi = qi = ki = vi). We will see how self-attention lets the network select different parts of the data to be the content (value) and other parts to determine where to pay attention (queries and keys). Consider 4 orthogonal base vectors all of equal `2 norm a, b, c, d. (Suppose that their norm is , which is some very, very large number.) Out of these base vectors, construct 3 tokens: x1 = d + b, x2 = a, x3 = c + b. a. What are the norms of x1, x2, x3? b. Compute (y1, y2, y3) = Self-attention(x1, x2, x3). Identify which tokens (or combinations of tokens) are approximated by the outputs y1, y2, y3. c. Using the above example, describe in a couple of sentences how self-attention that allows networks to copy an input value to the output.