Trabajo de Fin de Máster (Ingeniería Matemática, en la Universidad Complutense de Madrid) realizado por Carlos Perales. Versa sobre algoritmos de clasificación (machine learning) aplicado a tweets y reputación financiera.
Download luận văn đồ án tốt nghiệp ngành kế toán với đề tài: Kế toán và phân tích nghiệp vụ huy động tiền gửi dân cư tại Ngân hàng TMCP Sài Gòn Thương Tín Chi nhánh Cà Mau
Để xem full tài liệu Xin vui long liên hệ page để được hỗ trợ
:
https://www.facebook.com/garmentspace/
https://www.facebook.com/thuvienluanvan01
HOẶC
https://www.facebook.com/thuvienluanvan01
https://www.facebook.com/thuvienluanvan01
tai lieu tong hop, thu vien luan van, luan van tong hop, do an chuyen nganh
Nhận viết luận văn Đại học , thạc sĩ - Zalo: 0917.193.864
Tham khảo bảng giá dịch vụ viết bài tại: vietbaocaothuctap.net
5. NHẬN XÉT VÀ BÀI HỌC KINH NGHIỆM
5.1. Nhận xét về công đoạn tham gia trong thời gian thực tập
5.1.1. Khó khăn
5.1.2. Thuận lợi
5.2.Bài học kinh nghiệm rút ra cho sinh viên sau đợt thực tập
5.2.1.Bài học về xin thực tập
5.2.2.Bài học về thu thập thông tin tại ngân hàng
Luận Văn Giải Pháp Nâng Cao Năng Lực Cạnh Tranh Của Dịch Vụ Ngân Hàng Bán Lẻ. Thực hiện khảo sát các khách hàng cá nhân đã và đang sử dụng dịch của Vietcombank để đánh giá về mức độ hài lòng đối với chất lượng dịch vụ ngân hàng bán lẻ của Vietcombank, từ đó tổng hợp, phân tích để đưa ra các điểm mạnh, điểm yếu trong việc nâng cao năng lực cạnh tranh về dịch vụ ngân hàng bán lẻ của Vietcombank.
Download luận văn đồ án tốt nghiệp ngành kế toán với đề tài: Kế toán và phân tích nghiệp vụ huy động tiền gửi dân cư tại Ngân hàng TMCP Sài Gòn Thương Tín Chi nhánh Cà Mau
Để xem full tài liệu Xin vui long liên hệ page để được hỗ trợ
:
https://www.facebook.com/garmentspace/
https://www.facebook.com/thuvienluanvan01
HOẶC
https://www.facebook.com/thuvienluanvan01
https://www.facebook.com/thuvienluanvan01
tai lieu tong hop, thu vien luan van, luan van tong hop, do an chuyen nganh
Nhận viết luận văn Đại học , thạc sĩ - Zalo: 0917.193.864
Tham khảo bảng giá dịch vụ viết bài tại: vietbaocaothuctap.net
5. NHẬN XÉT VÀ BÀI HỌC KINH NGHIỆM
5.1. Nhận xét về công đoạn tham gia trong thời gian thực tập
5.1.1. Khó khăn
5.1.2. Thuận lợi
5.2.Bài học kinh nghiệm rút ra cho sinh viên sau đợt thực tập
5.2.1.Bài học về xin thực tập
5.2.2.Bài học về thu thập thông tin tại ngân hàng
Luận Văn Giải Pháp Nâng Cao Năng Lực Cạnh Tranh Của Dịch Vụ Ngân Hàng Bán Lẻ. Thực hiện khảo sát các khách hàng cá nhân đã và đang sử dụng dịch của Vietcombank để đánh giá về mức độ hài lòng đối với chất lượng dịch vụ ngân hàng bán lẻ của Vietcombank, từ đó tổng hợp, phân tích để đưa ra các điểm mạnh, điểm yếu trong việc nâng cao năng lực cạnh tranh về dịch vụ ngân hàng bán lẻ của Vietcombank.
Discover the new world of credit. In this PowerPoint developed for high school students, be introduced to the vocabulary of credit, what it is, and why it is important to maintain a good credit score.
Để xem full tài liệu Xin vui long liên hệ page để được hỗ trợ
:
https://www.facebook.com/garmentspace/
https://www.facebook.com/thuvienluanvan01
HOẶC
https://www.facebook.com/thuvienluanvan01
https://www.facebook.com/thuvienluanvan01
tai lieu tong hop, thu vien luan van, luan van tong hop, do an chuyen nganh
Download luận văn đồ án tốt nghiệp ngành tài chính ngân hàng với đề tài: Thực trạng rủi ro tín dụng tại Ngân hàng TMCP Sài Gòn Thương Tín chi nhánh Lâm Đồng, cho các bạn làm luận văn tham khảo
Các Nhân Tố Ảnh Hưởng Đến Quyết Định Vay Vốn Của Khách Hàng Cá Nhân. Tìm hiểu các nhân tố có ảnh hưởng tích cực vay vốn của khách hàng cá nhân như quy mô Ngân hàng, lãi suất, quy trình và thủ tục vay vốn. Đề xuất giải pháp nâng hoạt động cho vay khách hàng cá nhân tại Ngân hàng thương mại cổ phần Quân đội – Phòng giao dịch Tân Sơn Nhất
Phương thức thanh toán bằng lc trong thương mại quốc tếcuocvanchuyen .vn
L/C là gì? Thư tín dụng ( Letter of Credit – L/C) hay tín dụng thư là thư do ngân hàng phát hành, theo yêu cầu của người nhập khẩu, cam kết với người bán về việc thanh toán một khoản tiền nhất định, trong một khoảng thời gian nhất định, nếu người bán xuất trình được bộ chứng từ hợp lệ, đúng theo quy định trong L/C.
Tóm lại, L/C là thư cam kết của ngân hàng về việc trả tiền cho người xuất khẩu. Các đối tác ký kết hợp đồng thường có trụ sở ở những quốc gia khác nhau nên giữa các bên vẫn tồn tại sự thiếu tin tưởng lẫn nhau, phương thức tín dụng chứng từ giúp hai bên yên tâm về quyền lợi của mình.
Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace
Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace
Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace
Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace
Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace
Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace
Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace
Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace
Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace
Khóa luận: Một số biện pháp quản lý rủi ro tín dụng tại ngân hàng thương mại ...OnTimeVitThu
Khóa luận: Một số biện pháp quản lý rủi ro tín dụng tại ngân hàng thương mại cổ phần Á Châu (ACB)
Nhắn tin Zalo 0777.149.703 để nhận file word miễn phí
Nhận viết luận văn Đại học , thạc sĩ - Zalo: 0917.193.864
Tham khảo bảng giá dịch vụ viết bài tại: vietbaocaothuctap.net
Download luận văn thạc sĩ ngành luật kinh tế với đề tài: Pháp luật về bảo lãnh của Ngân hàng từ thực tiễn Ngân hàng TMCP Quân Đội – Chi nhánh Đà Nẵng, cho các bạn làm luận văn tham khảo
Nhận viết luận văn Đại học , thạc sĩ - Zalo: 0917.193.864
Tham khảo bảng giá dịch vụ viết bài tại: vietbaocaothuctap.net
Download luận văn đồ án tốt nghiệp ngành kế toán với đề tài: Hoàn thiện công tác quản trị rủi ro cho vay doanh nghiệp vừa và nhỏ tại Ngân hàng thương mại cổ phần Quân Đội - Chi nhánh Thanh Xuân
Nhận viết luận văn Đại học , thạc sĩ - Zalo: 0917.193.864
Tham khảo bảng giá dịch vụ viết bài tại: vietbaocaothuctap.net
Download luận văn đồ án tốt nghiệp ngành kế toán với đề tài: Giải pháp phát triển hoạt động môi giới tại công ty cổ phần chứng khoán MB – chi nhánh Lý Nam Đế, cho các bạn làm luận văn tham khảo
Phân tích báo cáo tài chính ở Techcombank thực trạng và giải pháp. Đã chia sẻ đến cho các bạn sinh viên những bài mẫu báo cáo thực tập ngành ngân hàng hoàn toàn miễn phí.
Luận văn tốt nghiệp tài chính ngân hàng: Một số giải pháp nhằm mở rộng hoạt động tín dụng tài trợ xuất nhập khẩu tại ngân hàng TMCP XNK Việt Nam chi nhánh Hà Nội
Để xem full tài liệu Xin vui long liên hệ page để được hỗ trợ
:
https://www.facebook.com/garmentspace/
https://www.facebook.com/thuvienluanvan01
HOẶC
https://www.facebook.com/thuvienluanvan01
https://www.facebook.com/thuvienluanvan01
tai lieu tong hop, thu vien luan van, luan van tong hop, do an chuyen nganh
Để xem full tài liệu Xin vui long liên hệ page để được hỗ trợ
:
https://www.facebook.com/garmentspace/
https://www.facebook.com/thuvienluanvan01
HOẶC
https://www.facebook.com/thuvienluanvan01
https://www.facebook.com/thuvienluanvan01
tai lieu tong hop, thu vien luan van, luan van tong hop, do an chuyen nganh
1. The document discusses the Standardized Approach for Counterparty Credit Risk (SA-CCR) which will replace existing approaches for calculating counterparty credit risk exposure from derivatives.
2. SA-CCR will be used for several regulatory purposes including capital requirements for counterparty credit risk and exposures to central counterparties.
3. Implementing SA-CCR represents a significant change and challenge for banks due to the increased complexity, data requirements, and need to integrate it across risk, finance and regulatory reporting functions.
Este documento resume los conceptos clave de riesgo, riesgo informático y administración de riesgos. Define riesgo como la posibilidad de que ocurra un evento adverso y explica que existen riesgos inherentes en auditorías. Describe los tipos de riesgos informáticos como riesgos de integridad, disponibilidad, confidencialidad y cumplimiento. Resalta que para minimizar riesgos se requiere implementar estrategias, procesos, controles y conocimientos en la administración de riesgos.
El marco lógico es una herramienta que ayuda a diseñar proyectos mediante la identificación de objetivos, actividades e indicadores. Se basa en dos principios: 1) la relación causa-efecto entre los componentes de un proyecto, y 2) la correlación entre objetivos, indicadores, verificación y supuestos. Proporciona un formato para definir objetivos de manera lógica y medir el éxito del proyecto.
Discover the new world of credit. In this PowerPoint developed for high school students, be introduced to the vocabulary of credit, what it is, and why it is important to maintain a good credit score.
Để xem full tài liệu Xin vui long liên hệ page để được hỗ trợ
:
https://www.facebook.com/garmentspace/
https://www.facebook.com/thuvienluanvan01
HOẶC
https://www.facebook.com/thuvienluanvan01
https://www.facebook.com/thuvienluanvan01
tai lieu tong hop, thu vien luan van, luan van tong hop, do an chuyen nganh
Download luận văn đồ án tốt nghiệp ngành tài chính ngân hàng với đề tài: Thực trạng rủi ro tín dụng tại Ngân hàng TMCP Sài Gòn Thương Tín chi nhánh Lâm Đồng, cho các bạn làm luận văn tham khảo
Các Nhân Tố Ảnh Hưởng Đến Quyết Định Vay Vốn Của Khách Hàng Cá Nhân. Tìm hiểu các nhân tố có ảnh hưởng tích cực vay vốn của khách hàng cá nhân như quy mô Ngân hàng, lãi suất, quy trình và thủ tục vay vốn. Đề xuất giải pháp nâng hoạt động cho vay khách hàng cá nhân tại Ngân hàng thương mại cổ phần Quân đội – Phòng giao dịch Tân Sơn Nhất
Phương thức thanh toán bằng lc trong thương mại quốc tếcuocvanchuyen .vn
L/C là gì? Thư tín dụng ( Letter of Credit – L/C) hay tín dụng thư là thư do ngân hàng phát hành, theo yêu cầu của người nhập khẩu, cam kết với người bán về việc thanh toán một khoản tiền nhất định, trong một khoảng thời gian nhất định, nếu người bán xuất trình được bộ chứng từ hợp lệ, đúng theo quy định trong L/C.
Tóm lại, L/C là thư cam kết của ngân hàng về việc trả tiền cho người xuất khẩu. Các đối tác ký kết hợp đồng thường có trụ sở ở những quốc gia khác nhau nên giữa các bên vẫn tồn tại sự thiếu tin tưởng lẫn nhau, phương thức tín dụng chứng từ giúp hai bên yên tâm về quyền lợi của mình.
Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace
Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace
Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace
Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace
Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace
Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace
Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace
Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace
Giá 10k, liên hệ page để mua tài liệu www.facebook.com/garmentspace
Khóa luận: Một số biện pháp quản lý rủi ro tín dụng tại ngân hàng thương mại ...OnTimeVitThu
Khóa luận: Một số biện pháp quản lý rủi ro tín dụng tại ngân hàng thương mại cổ phần Á Châu (ACB)
Nhắn tin Zalo 0777.149.703 để nhận file word miễn phí
Nhận viết luận văn Đại học , thạc sĩ - Zalo: 0917.193.864
Tham khảo bảng giá dịch vụ viết bài tại: vietbaocaothuctap.net
Download luận văn thạc sĩ ngành luật kinh tế với đề tài: Pháp luật về bảo lãnh của Ngân hàng từ thực tiễn Ngân hàng TMCP Quân Đội – Chi nhánh Đà Nẵng, cho các bạn làm luận văn tham khảo
Nhận viết luận văn Đại học , thạc sĩ - Zalo: 0917.193.864
Tham khảo bảng giá dịch vụ viết bài tại: vietbaocaothuctap.net
Download luận văn đồ án tốt nghiệp ngành kế toán với đề tài: Hoàn thiện công tác quản trị rủi ro cho vay doanh nghiệp vừa và nhỏ tại Ngân hàng thương mại cổ phần Quân Đội - Chi nhánh Thanh Xuân
Nhận viết luận văn Đại học , thạc sĩ - Zalo: 0917.193.864
Tham khảo bảng giá dịch vụ viết bài tại: vietbaocaothuctap.net
Download luận văn đồ án tốt nghiệp ngành kế toán với đề tài: Giải pháp phát triển hoạt động môi giới tại công ty cổ phần chứng khoán MB – chi nhánh Lý Nam Đế, cho các bạn làm luận văn tham khảo
Phân tích báo cáo tài chính ở Techcombank thực trạng và giải pháp. Đã chia sẻ đến cho các bạn sinh viên những bài mẫu báo cáo thực tập ngành ngân hàng hoàn toàn miễn phí.
Luận văn tốt nghiệp tài chính ngân hàng: Một số giải pháp nhằm mở rộng hoạt động tín dụng tài trợ xuất nhập khẩu tại ngân hàng TMCP XNK Việt Nam chi nhánh Hà Nội
Để xem full tài liệu Xin vui long liên hệ page để được hỗ trợ
:
https://www.facebook.com/garmentspace/
https://www.facebook.com/thuvienluanvan01
HOẶC
https://www.facebook.com/thuvienluanvan01
https://www.facebook.com/thuvienluanvan01
tai lieu tong hop, thu vien luan van, luan van tong hop, do an chuyen nganh
Để xem full tài liệu Xin vui long liên hệ page để được hỗ trợ
:
https://www.facebook.com/garmentspace/
https://www.facebook.com/thuvienluanvan01
HOẶC
https://www.facebook.com/thuvienluanvan01
https://www.facebook.com/thuvienluanvan01
tai lieu tong hop, thu vien luan van, luan van tong hop, do an chuyen nganh
1. The document discusses the Standardized Approach for Counterparty Credit Risk (SA-CCR) which will replace existing approaches for calculating counterparty credit risk exposure from derivatives.
2. SA-CCR will be used for several regulatory purposes including capital requirements for counterparty credit risk and exposures to central counterparties.
3. Implementing SA-CCR represents a significant change and challenge for banks due to the increased complexity, data requirements, and need to integrate it across risk, finance and regulatory reporting functions.
Este documento resume los conceptos clave de riesgo, riesgo informático y administración de riesgos. Define riesgo como la posibilidad de que ocurra un evento adverso y explica que existen riesgos inherentes en auditorías. Describe los tipos de riesgos informáticos como riesgos de integridad, disponibilidad, confidencialidad y cumplimiento. Resalta que para minimizar riesgos se requiere implementar estrategias, procesos, controles y conocimientos en la administración de riesgos.
El marco lógico es una herramienta que ayuda a diseñar proyectos mediante la identificación de objetivos, actividades e indicadores. Se basa en dos principios: 1) la relación causa-efecto entre los componentes de un proyecto, y 2) la correlación entre objetivos, indicadores, verificación y supuestos. Proporciona un formato para definir objetivos de manera lógica y medir el éxito del proyecto.
Este documento presenta la metodología de diseño de un Objeto Virtual de Aprendizaje (OVA) para facilitar la comprensión de las normas NIIF en estudiantes de grado 11. Incluye una descripción de las fases de análisis, diseño y desarrollo del OVA, con énfasis en las actividades, contenidos y estructura de cada una de las unidades que compondrán el curso virtual. El resumen propone utilizar la metodología AODDEI (Análisis, Diseño, Desarrollo, Evaluación
El documento presenta una introducción a la metodología del marco lógico. Explica que el marco lógico fue desarrollado en 1969 por USAID para mejorar la planificación y evaluación de proyectos, y desde entonces ha sido adoptado por organizaciones como el BID y GTZ. A continuación, detalla los 9 pasos clave de la metodología marco lógico para el diseño, planificación, ejecución y evaluación de proyectos.
Este documento presenta una metodología en 7 pasos para generar propuestas de solución formales mediante la investigación de operaciones. El proceso incluye identificar el problema, observar el sistema, formular un modelo matemático, verificar el modelo, seleccionar una alternativa, presentar resultados y evaluar las recomendaciones. Se provee un ejemplo de cómo aplicar estos pasos para resolver un problema en un banco relacionado con el tiempo de espera de los clientes. Adicionalmente, se discute la ubicación típica de los grupos de investig
Este documento presenta un proyecto para diseñar e implementar un nuevo sistema de evaluación del desempeño basado en competencias para el colectivo de "Convenidos" en Mútua de Terrassa. El proyecto incluye fases para definir el alcance, diseñar un modelo de competencias, desarrollar un sistema de evaluación, y ejecutar la implementación. Se propone una metodología participativa que involucre a los empleados y garantice la adecuación del modelo a la organización.
La escala salarial diferencia cada rol dentro de la empresa, es una herramienta que define una política salarial justa para los trabajadores de la empresa.
Las escalas salariales se diseñan para facilitar la administración de dichos salarios, asegurar un equilibrio interno y proporcionar remuneraciones competitivas en el ámbito laboral nacional.
Para lograr que el equipo de trabajo demuestre motivación y compromiso requiere que su salario sea balanceado, competitivo y justo a los ojos del trabajador.
Por todo esto, se requiere contar con una escala salarial que ayude a solventar las diferencias que existen entre las distintas actividades que existan.
Este documento proporciona orientación para la construcción de reactivos de opción múltiple de alta calidad. Explica la estructura básica de los reactivos, que consiste en una pregunta (base) y varias opciones de respuesta, incluida una respuesta correcta. Además, detalla una serie de normas y recomendaciones para redactar las preguntas, opciones y respuestas de manera clara, precisa y que evalúen lo que se pretende medir. El objetivo final es mejorar los instrumentos de evaluación educativa mediante
Este documento proporciona orientación para la construcción de reactivos de opción múltiple siguiendo normas y recomendaciones. Explica la estructura básica de los reactivos, que incluye una base y varias opciones de respuesta. También describe normas generales y específicas para los reactivos de opción múltiple, como redactar una base clara y precisa, incluir solo una respuesta correcta, y evitar opciones sinónimas o que sean parcialmente correctas. El objetivo es ayudar a los docentes a
Este documento proporciona ejemplos prácticos de técnicas para aplicar los principios de gestión de riesgos corporativos según el Marco COSO. Describe brevemente las técnicas aplicables a cada componente del Marco COSO e incluye un proceso de implantación de la gestión de riesgos corporativos en una organización.
Este documento describe técnicas para aplicar los principios de gestión de riesgos corporativos relacionados con el ambiente interno de una organización. Explica cómo los elementos del ambiente interno como la filosofía de gestión de riesgos, la cultura, la integridad y la estructura organizativa pueden afectar positiva o negativamente al éxito de una empresa. Además, proporciona ejemplos de declaraciones de filosofía de gestión de riesgos y herramientas para evaluar la cultura de una organización e impulsar valores
Este documento proporciona ejemplos prácticos de técnicas para aplicar los principios de gestión de riesgos corporativos según el Marco COSO. Explica brevemente cómo las organizaciones pueden implementar con éxito el proceso de gestión de riesgos, incluyendo el establecimiento de un equipo líder, obtener el apoyo de la alta dirección y desarrollar un plan de implementación.
Este documento presenta una introducción a los modelos de evaluación educativa y describe dos categorías principales de modelos: 1) Modelos clásicos, que incluyen modelos basados en la consecución de metas, la formulación de juicios y la adopción de decisiones, como los modelos de Tyler, Adams, Taba, Carreño y Hammond. 2) Modelos alternativos como la evaluación libre de metas y comunicativa. Se explican brevemente algunos modelos clásicos específicos y sus etapas. El documento proporciona una visión general de los
analisis y cuantificacion del riesgo en gestion de riesgosMargoth CR
El documento proporciona una introducción al análisis y cuantificación del riesgo en proyectos empresariales. Explica los métodos cualitativos, cuantitativos y semicuantitativos para analizar riesgos, así como el método de Montecarlo. También describe los pasos para desarrollar un modelo de riesgos, incluyendo la identificación de variables, simulación y generación de informes para obtener el perfil de riesgo del proyecto.
Este documento presenta los pasos para elaborar un plan de mejora como parte del proceso de autoevaluación de una institución educativa. Explica que el plan de mejora se basa en los resultados de la autoevaluación para establecer metas de mejora. Luego detalla los pasos como priorizar estándares, analizar indicadores, identificar causas y soluciones, y finalmente elaborar el plan de mejora con indicadores, acciones, responsables y recursos. El objetivo es que las instituciones eduquen aplicar esta metodología para mejorar continuamente.
Este documento describe los servicios de gestión de satisfacción del cliente ofrecidos por People Vox. People Vox realiza encuestas de satisfacción para medir la percepción de los clientes y establece sistemas para mejorar la calidad. Ofrece servicios personalizados que incluyen el diseño de cuestionarios, el análisis de datos, la presentación de resultados y recomendaciones para mejorar la satisfacción del cliente. Su enfoque se centra en medir, comunicar, implicar a las partes interesadas y establecer planes de acción basados en los
Este documento proporciona instrucciones paso a paso para que los docentes apliquen una rúbrica de evaluación para calificar portafolios de otros docentes como parte de un proceso de coevaluación. Explica cómo descargar la rúbrica, los portafolios asignados, familiarizarse con la rúbrica, calificar los portafolios fuera de línea y registrar las calificaciones en el sistema. El objetivo es orientar a los evaluadores para que apliquen la rúbrica de manera uniforme y objetiva a fin de valorar las prop
Este documento presenta soluciones a cinco problemas relacionados con la gestión de cadenas globales de valor. En cada problema se definen acciones estratégicas para agregar valor a la cadena de suministros tomando en cuenta factores como proveedores, procesos logísticos, internacionalización y herramientas tecnológicas. El documento concluye que una adecuada gestión de la cadena de valor requiere establecer relaciones con socios estratégicos y automatizar procesos mediante sistemas de planificación y administración.
Este documento presenta 10 instrumentos de evaluación bajo el modelo de competencias. Brevemente describe cada instrumento, cómo construirlo y para qué puede usarse. Los instrumentos son: lista de cotejo, lista de verificación, guía de observación, escala estimativa, rubrica, registro descriptivo, registro anecdótico, discusión guiada, portafolio de evidencias. El documento provee información concisa sobre cada herramienta de evaluación para medir el desempeño de los estudiantes.
T3 lc1. manual descriptivo de instrumentos de evaluaciónLuz Erika Bustinza
Este documento presenta 10 instrumentos de evaluación bajo el modelo de competencias. Brevemente describe cada instrumento, cómo construirlo y para qué puede usarse. Los instrumentos son: lista de cotejo, lista de verificación, guía de observación, escala estimativa, rubrica, registro descriptivo, registro anecdótico, discusión guiada, portafolio de evidencias. El documento provee información concisa sobre cada herramienta de evaluación para medir el desempeño de los estudiantes.
Similaire à Análisis de sentimiento como indicador reputacional - TFM (20)
Charla para la PyConES 2018 en Málaga, sobre cómo se pueden crear sistemas de recomendación de canciones usando análisis de Fourier, herramientas de machine learning no supervisado y Python.
A preliminary study of diversity in ELM ensembles (HAIS 2018)Carlos Perales
Presentation in the International Conference on Hybrid Artificial Intelligent Systems (HAIS) 2018 of a preliminary study of diversity in ensembles, applied to Extreme Learning Machine (ELM)
¿Podemos predecir si Twitter hundirá un banco?Carlos Perales
Charla de la PyCon ES 2016 en Almería, sobre clasificadores de texto y riesgo reputacional aplicado al ámbito financiero.
El análisis de sentimiento es una herramienta con la cual se exploran las opiniones de un producto mediante valoración automática de mensajes en redes sociales. Se ha utilizado esta herramienta sobre Twitter para extraer una métrica sobre la reputación que tiene una entidad financiera, y poder estimar las pérdidas por riesgo reputacional.
Estudio y simulación numérica de las ecuaciones de aguas somerasCarlos Perales
Trabajo de Fin de Grado de Carlos Perales González sobre las ecuaciones de aguas someras, también llamadas ecuaciones de shallow water, que son una simplificación de las ecuaciones de Navier-Stokes.
Algunos vídeos de los que se mencionan en la sección de resultados se pueden ver aquí: https://www.youtube.com/playlist?list=PLkjZXk8AWCPW18dZUjr093jvvx3NUvY5l
Registrado en Safe Creative: https://www.safecreative.org/work/1507284738401-tfg-simulacion-de-aguas-poco-profundas
Un estudio numérico sobre el número de MachCarlos Perales
Este documento presenta el cálculo del número de Mach crítico utilizando los métodos de la bisección y la secante. Se define el número de Mach y los diferentes regímenes de flujo. Se describe la ecuación a resolver y se grafican las funciones. Los programas en Matlab implementan ambos métodos numéricos para aproximar la solución, arrojando valores de 0.738 (bisección) y 0.7396 (secante) para un coeficiente de presión dado, con menos iteraciones en el método de la secante.
Energía fotovoltaica en España y el mundo (2004-2008)Carlos Perales
Se trata de un pequeño estudio sobre la producción fotovoltaica en España, la potencia instalada y la energía obtenida, comparando el crecimiento de este sector con el de otras partes del mundo.
Propagación de una enfermedad en poblaciones dinámicasCarlos Perales
Se trata de un estudio simplificado del comportamiento matemático de modelos de poblaciones con crecimiento que sufren una epidemia. Realizado por Carlos Perales para una asignatura del grado de Física de la UCO (Universidad de Córdoba)
Sobre la radiación Cherenkov (presentación)Carlos Perales
Presentación sobre el trabajo de la radiación Cherenkov, aquí extendido: http://www.slideshare.net/CarlosPerales/radiacin-cherenkov-carlos-perales-1 . Realizado por Carlos Perales para una asignatura del grado de Física de la UCO (Universidad de Córdoba)
Sobre la radiación Cherenkov y los rayos cósmicosCarlos Perales
Se trata de un fundamento teórico y resumen de las aplicaciones, en especial de la astrofísica, que tiene la radiación Cherenkov. Está realizado por el alumno Carlos Perales, de la Universidad de Córdoba UCO, para el grado de Física
Estilo Arquitectónico Ecléctico e Histórico, Roberto de la Roche.pdfElisaLen4
Un pequeño resumen de lo que fue el estilo arquitectónico Ecléctico, así como el estilo arquitectónico histórico, sus características, arquitectos reconocidos y edificaciones referenciales de dichas épocas.
Los puentes son estructuras esenciales en la infraestructura de transporte, permitiendo la conexión entre diferentes
puntos geográficos y facilitando el flujo de bienes y personas.
TIA portal Bloques PLC Siemens______.pdfArmandoSarco
Bloques con Tia Portal, El sistema de automatización proporciona distintos tipos de bloques donde se guardarán tanto el programa como los datos
correspondientes. Dependiendo de la exigencia del proceso el programa estará estructurado en diferentes bloques.
Presentación transferencia de calor Jesus Morales.pdf
Análisis de sentimiento como indicador reputacional - TFM
1. Trabajo de Fin de Máster
Análisis de sentimiento como indicador
reputacional
Alumno: Carlos Perales González
Tutor en la empresa: Hugo Marrao
Tutor en la universidad: Carlos Rivero Rodríguez
Máster de Ingeniería Matemática de la UCM
2. Agradecimientos
A Hugo y Rogelio, que me han ayudado en lo posible y más.
A Carlos Rivero, dispuesto siempre a solventar dudas.
A mi familia, que a pesar de la distancia, han estado siempre ahí.
4. Índice de cuadros
1. Comparación de la tasa de acierto frente a los distintos clasi-
ficadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Índice de figuras
1. Curva ROC del clasificador bayesiano ingenuo . . . . . . . . . 21
2. Curva ROC del clasificador de métrica reputacional . . . . . . 21
2
5. 1. Introducción y objetivos
Un producto no solo es valorado por la calidad o el precio del mismo; tam-
bién el consumidor tiene en cuenta, de forma más o menos presente, quién lo
está vendiendo. La confianza en el vendedor es clave en la venta del producto.
Esto significa que la reputación de quién vende es valorada en el proceso de
compra.
Esta relación entre las ganancias de una institución y su reputación está
presente en el ámbito financiero actual en el que, a consecuencia de la crisis
iniciada en 2008, es necesario acotar las pérdidas que se puedan producir a
consecuencia de la actividad financiera en la que participan y/o están ex-
puestas las entidades financieras.
El riesgo reputacional, según define la Autoridad Europea de la Banca
(European Banking Authority, o simplemente EBA), es el riesgo actual, o el
riesgo futuro, asociado a las ganancias de la institución, sus propios fondos
o su liquidez a consecuencia del daño de la reputación que la entidad pueda
tener [1]. La EBA está empezando a exigir a las distintas entidades finan-
cieras que operan en Europa tengan una medida de su propia reputación, a
fin de que puedan prever la fortaleza de sus relaciones con otras entidades
bancarias y con la sociedad misma.
Es por ello necesario que las autoridades financieras posean métodos y
técnicas con las que predecir pérdidas de capital. En el caso que nos ocupa,
se intenta establecer un método para medir el riesgo reputacional. Supone un
trabajo interesante definir una métrica sobre la cual medir este riesgo. Al ser
un tema de marcado carácter social, supone una gran dificultad poner sobre
la mesa algún análisis de carácter cuantitativo sobre el riesgo reputacional.
Se ha optado por seguir el camino del análisis de sentimiento (también cono-
cida como minería de opinión).
Aunque el riesgo reputacional sea un tema de estudio subjetivo, no tiene
por qué ser parcial. Los distintos tipos de riesgo se relacionan entre sí. Una
mala noticia sobre inversiones puede transmitirse en riesgo de mercado (al
caer abruptamente las acciones de la entidad en cuestión), o en riesgo opera-
cional, si los clientes dejan de comprar productos al percibir que la entidad
no es fiable (riesgo reputacional). La retirada de depósitos por parte de los
clientes también puede ser otra pauta para relacionar el riesgo reputacional
con otros tipos de riesgo.
3
6. Aunque la opinión sea algo subjetivo, existe una motivación para intentar
tratar esta información de forma imparcial, basándonos en que las opiniones
tienen la capacidad de resultar en unas consecuencias concretas.
En esta era de la información, parece desfasado realizar un estudio del
análisis del sentimiento mediante encuestas dirigidas, con el inconveniente
de que el hecho de encuestar introduce una perturbación en la opinión del
encuestado. Por ello, se prefiera el estudio mediante redes sociales.
Se ha elegido la red social Twitter como ámbito de estudio por varios
motivos. Entre ellos, la implantación que tiene en España y la brevedad y
concisión de sus mensajes, debido a su restricción de un máximo de 140 ca-
racteres.
Debido a la infraestructura de Twitter, podemos obtener otros datos im-
portantes, como el número de seguidores que alguien tiene, el número de veces
que se difunde un mensaje por la red, o una idea de la distribución geográfica
de los tweets que recogemos. Otro detalle a destacar es que también es un
medio en el cual las instituciones financieras vuelcan sus mensajes a través
de cuentas oficiales, por lo que se puede realizar un seguimiento de estas y
de su impacto social.
4
7. 2. Planteamiento
2.1. Definiciones
Para explicar el trabajo realizado, es necesario explicar las definiciones
que más adelante vamos a usar:
Riesgo reputación: significa el riesgo actual de pérdidas en las ganancias
de la institución o su liquidez debido a daños en la perspectiva que la
sociedad tiene de esta [1].
Polaridad: es la escala de valores (‘positivo’, ‘negativo’, ‘neutro’, . . .) que
se puede asignar a un elemento durante un análisis de sentimiento [2].
Análisis de sentimento: se trata de la determinación automatizada de la
subjetividad, polaridad y la fuerza que tenga un texto, independiente-
mente de si este está escrito con intención objetiva o subjetiva [3].
Corpus: Es el conjunto de mensajes de texto que se han escogido para hacer
análisis estadísticos y contrastar hipótesis sobre el área que estudian.
La construcción del corpus está orientada a una temática a estudiar [4].
Tweet: es un mensaje publicado en la red social Twitter. Consiste en un
texto cuya longitud tiene que ser menor o igual a 140 caracteres [5].
Además, el mensaje contiene otra información, como el usuario que lo
ha publicado y la fecha, así como puede portar otros datos como fotos,
un enlace web, una ubicación, un hashtag (etiqueta que se usa entre los
usuarios para encontrar mensajes de un tema específico), etc.
Aprendizaje automático: es una rama de la Ciencia de la Computación
que estudia el reconocimiento de patrones y explora el estudio y cons-
trucción de algoritmos que puedan aprender y realizar predicciones so-
bre los datos [6].
Aprendizaje supervisado: engloba a los métodos de aprendizaje auto-
mático que cuente con datos de entrenamiento separados por etiquetas
[7].
Aprendizaje vago: es un método de aprendizaje en el que quedan guar-
dados en memoria todo el conjunto de entrenamiento, y en lugar de
construir leyes de aprendizaje, un nuevo caso se compara con el set
de entrenamiento. Es decir, la generalización más allá de los datos de
entrenamiento es demorada hasta que se hace una pregunta al sistema
[8].
5
8. Aprendizaje entusiasta: es un método de aprendizaje en el que el sistema
intenta construir una función objetivo durante el periodo de entrena-
miento, a diferencia del aprendizaje vago [9].
Clasificador: Es aquel instrumento matemático que se sirve de un algorit-
mo estadístico con el fin de asignar alguna característica a una entidad,
asignando una etiqueta clasificatoria. Este instrumento se construye
mediante aprendizaje automático [10].
2.2. Presentación del problema
Por parte de la empresa NFQ Solutions S.L., se ha presentado un proyec-
to capaz de adaptarse a las futuras exigencias de la EBA, parece necesario
que las instituciones financieras tengan un método para evaluar este riesgo.
Para ello, se han estudiado los mensajes publicados en la red social Twitter
(llamados tweets).
Estos mensajes o tweets pueden portar distinto tipo de información: el
texto, el usuario que lo publica, la fecha en la que lo hace, los usuarios a los
que los envía , la ubicación desde que se publica, una enlace web a una no-
ticia, etc. Los tres primeros campos (texto, fecha y usuario que publica) son
siempre obligatorios, siempre están incluidos, y son los que más información
proporcionan.
Debido a la cantidad de usuarios que frecuenta esta red social nada más
que en español, es conveniente que este estudio se realice de forma automáti-
ca. Es por ello que nos basamos en el análisis de sentimiento. Se construirán
algoritmos de aprendizaje supervisado (tendrás las etiquetas ‘positivo’ y ‘ne-
gativo’) y entusiasta (se construirán una serie de reglas de predicción).
El sistema de trabajo es el siguiente: se parte de un conjunto de mensajes
(el texto de los tweets) que ha sido valorado manualmente, siguiendo el crite-
rio que la EBA propone. Con este set entrenamos un clasificador que consiga
puntuar los tweets en función de su texto. El Trabajo de Fin de Máster se
ha orientado en construir y probar distintos clasificadores.
2.3. Clasificadores
El método para clasificar los tweets en ‘positivos’ o ‘negativos’, desde el
punto de vista de la reputación comentado en 2.1, será el del aprendizaje
6
9. supervisado. Esto implica, que tenemos que preparar de manera correcta el
set de entrenamiento para que se puedan construir las reglas de clasificación.
Básicamente, se realizará un seguimiento de los mensajes públicos emitidos
en la red social Twitter.
El corpus se ha realizado manualmente, eligiendo aquellos tweets más
relevantes. Estos se han escogido con los tweets más retweeteados (republica-
dos por los usuarios) en Twitter. Así nos aseguramos que, cogiendo n tweets
únicos (no repetidos), estos tengan la máxima representatividad posible. Ade-
más, trabajamos con la hipótesis de que los tweets más compartidos versan
sobre los temas más comentados y/o relevantes.
2.4. Preparación del corpus. Entrenamiento y valida-
ción
Para generar los clasificadores es necesario escoger correctamente los tweets
para el corpus. Se han buscado los 50 tweets más republicados en la red so-
cial cada 3 días y medio (100 tweets por semana). Estos mensajes han sido
valorados a mano por empleados de NFQ Solutions, atendiendo a los criterios
que la EBA en su informe indican para el riesgo reputacional.
El criterio de seleción para escoger el corpus es realizar una búsqueda
en tiempo real de los mensajes que se publican en Twitter mencionando a
una institución financiera, y almacenarlos. De esos tweets, se escogen los que
cumplen los criterios para discernir si son ‘buenos’ o ‘malos’ según el criterio
de reputación de la EBA [1].
El principal motivo para esta división cada 3 días y medio es, primero,
que así se escogen 100 tweets por semana. El segundo motivo es que se ha
visto en la base de datos que la empresa poseía que los temas de los cuales
se hablaban en la red social, relacionados con la métrica de una institución
financiera concreta, solían durar en torno a 3 días. Bajo esta hipótesis (si una
noticia es relevante, lo será durante 3 días aproximadamente) escogemos un
intervalo de 3 días y medio para evaluar los tweets más republicados.
Esta hipótesis también indica que será necesario reentrenar el corpus cada
cierto tiempo. Esto es importante solo en las primeras etapas del proyecto,
cuando el corpus aún no es lo suficientemente grande y, por tanto, no es ca-
paz de tratar todas las temáticas que tenemos. Esta fase de entrenamiento
terminará cuando el corpus sea sufcientemente grande. La Sociedad Española
7
10. de Procesamiento del Lenguaje, por ejemplo cuena con corpus sobre política
de más de 60000 tweets.
Como el estudio lo hemos realizado para una institución financiera concre-
ta, de la que se han ido recopilando tweets, valorando a mano como positivos
y negativos y construyendo modelos. Finalmente, se han dividido los tweets
valorados manualmente en dos sets: uno de entrenamiento (llamado training)
y otro de test (denominado 100ac). La notación del set de test proviene de
que se ha utilizado un corpus de 200 tweets, 100 positivos y 100 negativos,
para usarlos como valoración. El set de entrenamiento contiene 4000 tweets
valorados manualmente. Este set también está en proporción 50 − 50 entre
positivos y negativos.
Entre los tweets recogido, hemos encontrados tweets que hemos seleccio-
nado para el corpus (positivos o negativos) y tweets que no sirven para la
reputación. Un ejemplo de esto son los siguientes tweets
1. @CABK_Responde ¿en Madrid mañana viernes santo abren las ofici-
nas de la caixa? el horario de semna santa en la web pone de l-v hasta
las 14.
2. Buenas @FINTONIC podéis arreglar los problemas con @infoCaixa
@CABK_Responde ? Si el problema es de La Caixa mañana mismo
cierro la cuenta.
3. ¡Buenas noticias! La Caixa y el CDTI crean un fondo de 20 millones
para startups científicas.
En estos tres ejemplos, el primero no se tendría en cuenta para el corpus
reputacional. El segundo sí, y sería considerado negativo, y el tercero también,
aunque se etiquetaría como positivo.
2.5. Teorema de Bayes
Trataremos con categorías y elementos, que pueden entrar en una cate-
goría u otra. Por eso, es interesante presentar qué es el teorema de Bayes.
El teorema de Bayes explica la relación expresa la probabilidad condi-
cional. Es decir, si tenemos distintos eventos que pueden o no ocurrir, la
probabilidad que ocurra uno si otro ya sabemos que ha ocurrido. Y esto se
realiza relacionando la probabilidad de A dado B con la probabilidad de b
8
11. dado A.
Formalmente, se expresa que si tenemos dos eventos, A y B, podemos
expresar la probabilidad de que ocurra A si sabemos que B ha ocurrido
P(B|A) =
P(A|B)P(B)
P(A)
(1)
P(A): Probabilidad de que ocurra el evento A.
P(B): Probabilidad de que ocurra el evento B
P(A|B): Probabilidad de que ocurra el evento A sabiendo que el evento B
ha ocurrido.
P(B|A): Probabilidad de que ocurra el evento B sabiendo que el evento A
ha ocurrido.
Usaremos este teorema cuando queramos construir las probabilidades de
positivo y negativo de un texto, basándonos en las variables predictoras (fea-
tures) en las que podamos descomponer los tweets.
9
12. 3. Metodología de clasificación de texto
Para este Trabajo de Fin de Máster, la clasificación de un tweet en ‘posi-
tivo’ o ‘negativo’ para una entidad financiera se atendrá solo a características
de su texto, si bien es cierto podían atenerse a otros campos que el tweet con-
tenga, como el usuario que lo publica, la ubicación desde la que se publica. . .
3.1. Construcción del clasificador
Podemos construir la probabilidad de que un tweet sea positivo o nega-
tivo a partir de las probabilidades de cada variable predictora o feature en
las que podamos dividirlo. La extracción de features aparece detallada en el
subapartado 3.2. Aunque las únicas features que tengamos en cuentan pro-
vendrán del campo del texto, el desarrollo es válido si queremos escoger como
variables, por ejemplo, el número de retweets, el usuario, etc.
Utilizamos el teorema de Bayes (1) explicado en el apartado 2.5. Pero
primero tenemos que indicar cómo se define un tweet a través de sus variables
predictoras. Vamos a proponer incialmente que, dado un tweet, este queda
determinado como un vector de features [11] que, definido en conjuntos, es
una intersección de estas.
tweet = (feature1, feature2, . . . , featuren) =
i
fi ≡ features (2)
Esto significa que un tweet está únicamente determinado por sus features.
Es la construcción de los elementos a clasificar es la que se utiliza habitual-
mente en la bibliografía [12]. Podemos usar (1) y (2) de manera que podemos
estimar la categoría (positivo o negativo) en la que se clasifica un tweet.
P(pos|features) =
P(pos)P(features|pos)
P(features)
(3)
Siendo:
P(pos|features) : Probabilidad de que dado un conjunto de features en cues-
tión sea positivo.
P(pos) : Probabilidad, a priori, de que un elemento sea positivo. Es lo que
se conoce como prior positive o probabilidad a priori de positivo.
10
13. P(features|pos) : Probabilidad de que el features en cuestión aparezca en
el corpus positivo.
P(features|neg) : Probabilidad de que el features en cuestión aparezca en
el corpus negativo.
El prior positive está íntimamente relacionado con nuestro set de entre-
namiento. Si existen más features positivos que negativos, parece lógico que
el clasificador, sin información sobre el features a tratar (es decir, a priori)
establezca que existe una mayor probabilidad de entrar en el grupo positivo
que en el negativo.
Pero esto no siempre es una buena opción. Si queremos capturar ambos
eventos por igual, conviene preestablecer una probabilidad a priori uniforme
(con dos etiquetas, P(pos) = P(neg) = 1/2), de manera que a ninguno de
los dos corpus tenga mayor importancia.
Vamos a considerar únicamente la probabilidad de ser positivo (o sim-
plemente probabilidad de positivo) puesto que vamos a tener en cuenta dos
categorías, positivo y negativo, que además son complementarias.
Debido a esta complementariedad, se puede escribir P(features) como
features = (features∩pos) (features∩neg) = features∩pos+features∩neg
(4)
Porque la intersección es nula. Usando (4),
P(features) = P(pos)P(features|pos) + P(neg)P(features|neg) (5)
Se puede reescribir (3) usando (5)
P(pos|features) =
P(pos)P(features|pos)
P(pos)P(features|pos) + P(neg)P(features|neg)
La cuestión recae ahora en cómo expresamos esa probabilidad de las va-
riables predictoras. Vamos a suponer la hipótesis de independencia entre las
variables
P(fi ∩ fj) = P(fi|fj)P(fj) = P(fi)P(fj) ∀i,j i = j (6)
11
14. Con esta hipótesis, y con la regla de la cadena, podemos escribir P(features|pos)
como
P(features|pos) =
P(( i fi) ∩ pos)
P(pos)
=
P((f1, f2, . . . , fn, pos)
P(pos)
=
P((f1|f2, . . . , fn, pos) . . . P(fn|pos)
P(pos)
= i P(fi ∩ pos)
P(pos)
=
i
P(fi|pos)
Al aplicar esta hipótesis de independencia, con la construcción del tweet
sobre sus features como (2), estamos construyendo un clasificador Bayesiano
Ingenuo (Naive Bayes classifier). En nuestro caso, eso significa que el hecho
de que aparezca una features no modifica las probabilidades de que los demás
features puedan surgir en el tweet.
Es por esta hipótesis de independencia (6) por lo que se adjetiva ‘inge-
nuo’. Es realmente posible que la aparición o no de variables esté relacionadas
entre sí, pero por simplicidad del clasificador, no se considera estas relaciones
[12]. No solo aplicamos esta hipótesis por simplicidad; además, el resultado
que obtenemos, que podemos ver en el apartado 4 no es nada desdeñable.
Formalmente, esto se expresa como
P(pos|features) =
P(pos) i P(fi|pos)
P(pos) i P(fi|pos) + P(neg) i P(fi|neg)
(7)
El clasificador bayesiano ingenuo supone que la influencia que la presencia
de un feature en un texto tiene una importancia para que sea el texto sea
considerado positivo o negativo independiente del resto de features.
A partir de las probabilidades de los features, construimos la probabilidad
de que un tweet sea considerado como positivo o negativo. Esta construcción,
de abajo a arriba, suponiendo que un feature tiene una probabilidad asocia-
da, lo que le da el nombre de clasificador bayesiano ingenuo. Supone, además,
que la presencia o ausencia de features en el tweet contribuye de manera in-
dependiente a la probabilidad de ser positivo.
Usando la misma hipótesis de independencia (6), otro clasificador puede
construirse. Para ello, volvemos a la interrelación tweets features de (2).
12
15. Puede que no interese que un tweet quede única y exclusivamente determi-
nado por sus features. Para hacer esta definición más laxa, sustituimos la
intersección con la unión.
tweet ∼
i
fi ≡ features (8)
Es decir, que en lugar de que un tweet quede definido por sus features, el
tweets pasa a ser un ‘promedio’ de estas. A esta construcción distinta, se ha
llamado indicador reputacional, puesto que está amparada y justificada por
la elección del corpus específico reputacional. A menudo, hemos probado a
quitar y probar features para mejorar el acierto, y esto no es congruente con
una definición sólida y determinista como (2).
La probabilidad P(features|pos) se puede escribir como:
P(features|pos) =
P(( i fi) ∩ pos)
P(pos)
=
P((f1 ∪ f2 ∪ . . . ∪ fn) pos)
P(pos)
=
P( i(fi ∩ pos)
P(pos)
= i P(fi ∩ pos)
P(pos)
=
i
P(fi|pos)
La construcción del indicador reputacional I(pos|features) a partir de
las probabilidades de los features, en lugar de mediante el productorio, se
realiza mediante el promedio.
I(pos|features) =
P(pos) i P(fi|pos)
P(pos) i P(fi|pos) + P(neg) i P(fi|neg)
Multiplicando por n
n
, no modificamos nada, y puede verse esa noción de
tweets como promedio de sus features.
I(pos|features) =
P(pos)1
n i P(fi|pos)
P(pos)1
n i P(fi|pos) + P(neg)1
n i P(fi|neg)
(9)
Donde n es el número de features que se pueden formar a partir del tex-
to. Este indicador funciona como una probabilidad promedio de las features,
manteniéndose normalizada en 0 ≤ I(pos|features) ≤ 1.
13
16. Como se explicará en el apartado 4, el acierto del algoritmo usando (7) y
(9) son prácticamente el mismo. La ventaja que la construcción de la métrica
reputacional (9) aporta es que, cuando se puntúan casos nuevos, la proba-
bilidad de positivo no es cercana a los extremos (0 ó 1), sino que adquiere
valores intermedios, como 0,3 ó 0,7. El clasificador bayesiano ingenuo (7),
por su construcción, otorga probabilidades siempre rondando, o 0,9, o 0,1.
Es decir, claramente, se aprecia un overfitting, debido a la construcción del
bayesiano ingenuo.
Es decir, que el clasificador bayesiano ingenuo, aunque acierta lo mismo
que el clasificador por métrica reputacional, cuando designa probabilidades
para estar etiquetado como positivo o negativo.
Por ejemplo, un clasificador bayesiano ingenuo de manzanas puede cla-
sificar una fruta como tal usando la información de todas sus propiedades
físicas conjuntamente. Dirá que una fruta a clasificar es manzana si es roja,
redonda y de alrededor de 7 cm de diámetro. Es decir, la intersección de esas
features, si bien es verdad que luego supone independencia entre ellas.
Nuestro indicador, por otra parte, diría que una fruta es una manzana en
función de sus propiedades ‘ser roja’, ‘ser redonda’ y ‘alrededor de 7 cm de
diámetro’, y haría un promedio de las probabilidades obtenidas.
3.2. Extracción de features y construcción de n-gramas
Por simplicidad, en lugar de construir clasificadores para todos los fea-
tures posibles, lo que el algoritmo hará será clasificar el texto siguiendo las
frecuencias de las palabras y combinaciones de palabras que aparezcan en el
set de entrenamiento que tenga definido. Nuestras features entonces serán las
combinaciones ordenadas de palabras de los textos de los tweets.
La forma de construir esta probabilidad es la que nos otorgará la posibi-
lidad de construir unos u otros clasificadores. El tratamiento al texto pasa
por extraer las features, los elementos más importantes del texto. Nuestra
extracción de features empieza con una división en n-gramas. En general,
un n-grama es una subsecuencia de n elementos de una secuencia dada. En
nuestro caso, llamamos n-grama a una secuencia de n palabras que aparecen
consecuentemente en el texto de un mensaje. Dada las característica del len-
guaje español, hemos probado a introducir distintos n-gramas. Finalmente,
nuestro entrenamiento posee trigramas (n = 3), bigramas (n = 2) y unigra-
14
17. mas o monogramas (n = 1).
Posteriormente, a cada n-grama se le aplica la eliminación de stopwords.
Las stopwords no son más que un conjunto de palabras, elegido arbitraria-
mente, que hemos decidido eliminar de nuestro conjunto de entrenamiento.
Entre las stopwords podemos incluir, por ejemplo, artículos, preposiciones,
conjunciones. . . Se ha escogido como stopwords el conjunto en español que
se incluye en la librería de Python NLTK [13].
Para finalizar con este proceso de extracción de features, a los n-gramas
se le aplica un proceso de búsqueda de lexemas o stemming. La búsqueda de
lexemas es un método para reducir una palabra a su raíz (en inglés, stem, de
ahí el nombre).
La reducción de la palabra tiene el objetivo de poder comparar varias pa-
labras técnicamente distintas (comía, comeréis) pero esencialmente iguales a
una raíz, para poder compararlas. Este método podría obviarse en el trata-
miento del análisis de sentimiento, pero implicaría no sabríamos exactamente
cuántas veces aparece repitido el verbo comer en nuestro set de entrenamien-
to, pero sí cada forma verbal por separado. Cabe destacar que el stemming
no se aplica exclusivamente a los verbos, también a los plurales y a los géneros.
Por ser el idioma español omplejo, y con menos implementación en la pro-
gramación que el inglés (lenguaje general en la programación), las librerías
de búsquedas de lexemas están orientadas sobre todo al inglés. La librería
que se ha usado (NLTK) para la búsqueda de lexemas resulta agresiva (por
ejemplo, elimina todas las palabras que terminan en a u o). A pesar de esta
agresividad al tratar el texto, el resultado es igualmente válido.
3.3. De n-gramas a texto. Estimación de parámetros
Si seguimos el desarrollo del apartado anterior, lo que tenemos para tra-
bajar es un conjunto de combinaciones (ordenadas) de lexemas que poseen la
misma valoración que el texto completo del cual provienen. Es decir, no solo
extraemos las features del texto, sino que propagamos la valoración manual
que hemos asignado el texto.
El objetivo no es otro que construir el clasificador de texto en función de
las veces que se repiten determinados n-gramas. Esto significa que el proceso
anteriormente descrito para extraer la información del corpus de entrena-
15
18. miento se repetirá para el texto de cada tweet que queramos analizar.
Entonces, tenemos un conjunto de n-gramas valorados como positivos y
otro como negativos. Es cierto que los n-gramas no tiene ‘significado posi-
tivo’ o ‘significado negativo’ por sí mismos. Sin embargo, a partir de esta
información sí que podemos reconstruir la probabilidad de que un tweet sea
positivo o negativo.
Lo que esperamos con los n-gramas es que se repitan, y estos aparezcan en
los dos conjuntos: en el de positivo, y en el de negativo. Por tanto, podemos
asignar a cada n-grama la probabilidad de ser positivo basándonos en las
veces que se repite en uno y otro conjunto. Aplicando el teorema de Bayes,
P(pos|ngram) =
P(ngram|pos)P(pos)
P(ngram|pos)P(pos) + P(ngram|neg)P(neg)
(10)
Siendo:
P(pos|ngram): Probabilidad de que el n-grama en cuestión sea positivo.
P(pos): Probabilidad, a priori, de que un elemento sea positivo.
P(ngram|pos): Probabilidad de que el n-grama en cuestión aparezca en el
corpus positivo.
P(ngram|neg): Probabilidad de que el n-grama en cuestión aparezca en el
corpus negativo.
Como nuestro objetivo está orientado al riesgo reputacional, podría ser
contraproducente establecer que es más probable que un tweet entre en una
categoría que en otra. Un evento asociado a una institución financiera puede
mover seriamente la balanza de la reputación, con lo que establecer a prirori
una tendencia ensuciaría el resultado que queremos ver.
Volviendo a (10), podemos calcular la probabilidad de que un n-grama
sea positivo (P(pos|ngram)) sabiendo la probabilidad de que aparezca en el
conjunto positivo (P(ngram|pos)) y en el negativo (P(ngram|neg)).
Estas probabilidades se construyen en función de la frecuencia. Es decir,
la probabilidad es una función de las veces que se puede encontrar dicho n-
grama en el conjunto positivo y en el negativo.
16
19. Varias construcciones de la probabilidad han sido probadas. La primera,
es la probabilidad de Laplace, o de Laplace simple:
P(ngram|pos) =
d
N
(11)
Siendo:
d: Número de veces que aparece en el conjunto positivo.
N: Número de veces que aparece en los dos conjunto.
A pesar de que la probabilida de Laplace simple es sencilla y ampliamente
conocida, en nuestro caso posee principalmente dos problemas. El primero es
que, para pocas ocurrencias del n-grama en nuestro corpus, la probabilidad
surge fuertes variaciones ante la introducción de un n-grama más.
Veámoslo con un ejemplo: supongamos que tenemos el n-grama ‘muy
bueno‘, solo una vez. Aparece en el conjunto positivo, pues proviene del
texto ‘Esto me parece muy bueno‘. Entonces, por la probabilidad de Laplace
simple, ese n-grama tendría la probabilidad
P(pos|ngram) =
1
1
= 1
Es decir, con poca información, determinaría que la probabilidad que
otorga el n-grama es de P = 1. Hablamos de ‘otorgar probabilidad‘ por la
hipótesis del bayesiano ingenuo.
Ahora, añadimos al entrenamiento el tweeet ‘Esto no es muy bueno‘, con
valoración manual negativa. Este n-grama, ahora, aparece una vez en positivo
y otra en negativo. La probabilidad, ahora, baja drásticamente
P(pos|ngram) =
1
2
= 0,5
Si añadimos otra vez más ese n-grama a uno de los dos conjuntos, la pro-
babilidad vuelve a cambiar abruptamente. Este es el primer problema que
presenta.
El segundo problema consiste en que, si la frecuencia de n-gramas es baja
(hemos entrenado pocos textos donde aparecen esos n-gramas), es posible
que asigne alto valor de la probabilidad a uno de los dos conjuntos. Como
podemos sacar del caso anterior, si tenemos un n-grama repetido tres veces,
y tres veces en uno de los conjuntos, la probabilidad será 1 (ó 0) sin que
17
20. haya probabilidad en el otro de los conjuntos. Nos interesa un clasificador
que asigne probabilidades alejadas a los extremos (1 ó 0), porque ocurre que
nos interesa que nuestro clasificador, cuando yerre por falta de información,
falle por asignado probabilidades de positivo cercanas a 0,5 y no cercanas a
los extremos
Estudiando la información con la que tratamos, este es un caso que ocurre
en algunas ocasiones, e influye negativamente en la clasificación de los tweets.
Es por esto que se hace necesario trabajar con alguna otra probabilidad di-
ferente, pero que recoja también la información que la frecuencia recuerde.
La probabilidad que hemos probado, que solventa los problemas ante-
riormente mencionados y arroja una mejor predicción es la probabilidad de
Laplace suavizada o adición suavizada.
La construcción de esta probabilidad viene dada por una composición en-
tre la probabilidad de Laplace simple y la probabilidad uniforme. Es decir,
combina el conocimiento de las frecuencias con una cierta indeterminación
equiprobable de que la clasificación caiga en cualquiera de las posibles cate-
gorías (en nuestro caso, 2, positivo o negativo).
P(ngram|pos) =
d + α
N + ncatα
(12)
Donde:
d: Número de veces que aparece en el conjunto positivo.
N: Número de veces que aparece en los dos conjuntos.
ncat: Número de categorías.
α: Parámetro de suavizado
En nuestro caso, vamos trabajar solo con dos categorías, luego ncat = 2.
Si quisiéramos introducir otras categorías más, aumentaríamos ese número.
Comparando estas dos probabilidades para distintos textos de tweets, co-
mo explicaremos en el apartado 4, la tasa de acierto (el cociente entre las
veces que el algoritmo acierta entre el total de casos) es la misma usando
(12) que (10).
18
21. 4. Resultados
Se ha entrenado el clasificador bayesiano ingenuo (7) y el clasificador de
indicador reputacional (9) con el test de entrenamiento de aproximadamente
4000 tweets, balanceado 50 − 50 y 38000 features. Los textos de estos, como
se ha indicado en apartados anteriores, han sido divididos en n-gramas, al-
macenando también las frecuencias para construir las probabilidades.
4.1. Ejemplos de tweets
Tenemos el texto de un tweet positivo:
‘CaixaBank pone en marcha su oficina de representación en Sudáfrica para
apoyar los proyectos empresariales’
Podemos dividirlo en unigramas, bigramas y trigramas. Aplicando el pro-
ceso de eliminación de stopwords y de stemming, los n-gramas quedan de la
siguiente forma:
‘caixabank’, ‘reconoc’, ‘compromis’, ‘conciliacion’, ‘laboral’, ‘famili’, ‘cai-
xabank reconoc’, ‘reconoc por’, ‘por su’, ‘su compromis’, ‘compromis con’,
‘con la’, ‘la conciliacion’, ‘conciliacion laboral’, ‘laboral y’, ‘y famili’, ‘caixa-
bank reconoc por’, ‘reconoc por su’, ‘por su compromis’, ‘su compromis con’,
‘compromis con la’, ‘con la conciliacion’, ‘la conciliacion laboral’, ‘concilia-
cion laboral y’, ‘laboral y famili’
Para nuestro clasificador por indicador reputacional, le otorga una proba-
bilidad de positivo de P = 0,7894, y para nuestro clasificador por bayesiano
ingenuo, P = 0,9999. Vemos otros textos diferentes:
Texto: ‘Esta semana Caixabank ha concedido una ayuda a la ONG Te toca
Actuar para la compra de materiales’
PNB = 0,9999
PI = 0,6684
Texto: ‘CaixaBank, reconocida por su compromiso con la conciliación la-
boral y familiar’
PNB = 0,3489
19
22. PI = 0,4977
Este tweet en particular es un ejemplo claro de por qué queremos un
clasificador que no asigne probabilidad cercana a los extremos. No es lo mismo
que se haya confundido el tweet anterior como ‘negativo’ con P 0,5 que
con P 0,35
4.2. Tasa de acierto
Se han usado los clasificadores para valorar el set set 100ac. Se ha compa-
rado los valores que los clasificadores otorgan frente a los reales (el set 100ac
ha sido valorado a mano, y se considerna estos valores como buenos).
Clasificadores/Acierto Acierto (set test) Acierto (set entrenamiento)
Bayesiano ingenuo 0.790 0.990
Métrica reputacional 0.715 0.995
Cuadro 1: Comparación de la tasa de acierto frente a los distintos clasifica-
dores
4.3. Curva ROC
La curva ROC (Receiver Operating Characteristic o Característica Ope-
rativa del Receptor) es una técnica para visualizar, organizar y seleccionar
clasificadores basados en comparación de dos características operativas (la
tasa de verdaderos positivos, TPR, y la tasa de falsos positivos) conforme el
umbral discriminante cambia [14]. El área bajo esta curva representa la pro-
babilidad de que un caso que el clasificador haya categorizado como positivo,
efectivamente, sea realmente positivo [15].
Se han construido la curva ROC usando la librería scikit-learn de Python
[16]. Los datos usados son los mismos que en el apartado anterior, sobre las
probabilidades que arrojan los dos clasificadores sobre los sets set de test y
de entrenamiento. El área bajo la curva (Area Under Curve) de los dos sets
se incluye en la leyenda.
20
23. Figura 1: Curva ROC del clasificador bayesiano ingenuo
Figura 2: Curva ROC del clasificador de métrica reputacional
21
24. 5. Conclusiones
Tras los resultados expuestos en el apartado 4, para nuestro objetivo
(diseñar un clasificador de texto orientado al riesgo reputacional) es mejor
apostar por la métrica reputacional (9). Aunque basada en la hipótesis de in-
dependencia de las variables predictoras (features), su tasa de acierto y área
bajo la curva es mayor que en el clasificador bayesiano ingenuo (7), usando
el mismo set de entrenamiento.
El campo recién explorado del análisis de sentimiento en redes sociales
abre varias puertas para ser explorado. Por ejemplo, el hecho de trabajar con
variables predictoras no necesariamente se limita a tratar con n-gramas. En-
tre esas variables predictoras, por ejemplo, además de n-gramas se podrían
incluir como variables los usuarios, los hashtags, las páginas de noticias que
se tweetean, etc.
Durante la selección del corpus, se han podido discernir cuatro temáticas
en las cuales se podría dividir:
1. noticias
2. económico
3. promoción
4. social/otros
Esto podría ser motivación para probar un algoritmo de clasificación no
supervisionada, pero debido por problemas de tiempo y de tamaño del set
de entrenamiento, no se ha seguido esta línea de trabajo.
Por otra parte, es criticable usar la hipótesis de independencia (6) cuando
hablamos de texto, pues las frases tienen un orden gramatical. Sin embargo,
esta hipótesis nos permite trabajar con soltura y rapidez sin por ello conseguir
malos resultados. Se ha intentado preservar esta información del ‘orden’ a
través de los n-gramas. También se podrían tener en cuenta también otros
clasificadores que si otorgasen información sobre el orden, como los árboles
de decisión.
22
25. Referencias
[1] European Banking Authority. Article 107 (3) of directive 2013/36/eu
council regulation (EU) no 269/2014.
[2] Bo Pang and Lillian Lee. Seeing stars: Exploiting class relationships for
sentiment categorization with respect to rating scales. In Proceedings
of the 43rd annual meeting on association for computational linguistics,
pages 115–124. Association for Computational Linguistics, 2005.
[3] Julian Brooke, Milan Tofiloski, and Maite Taboada. Cross-linguistic
sentiment analysis: From english to spanish. In RANLP, pages 50–54,
2009.
[4] Chantal Pérez Hernández. Explotación de los córpora textuales infor-
matizados para la creación de bases de datos terminológicas basadas en
el conocimiento. Estudios de lingüística del español, (18):1, 2002.
[5] Twitter. Preguntas frecuentes para usuarios nuevos.
[6] Ron Kohavi and Foster Provost. Glossary of terms. Machine Learning,
30(2-3):271–274, 1998.
[7] Mehryar Mohri, Afshin Rostamizadeh, and Ameet Talwalkar. Founda-
tions of machine learning. MIT press, 2012.
[8] Walter Daelemans and Antal Van den Bosch. Memory-based language
processing. Cambridge University Press, 2005.
[9] Iris Hendrickx and Antal Van Den Bosch. Hybrid algorithms with
instance-based classification. In European Conference on Machine Lear-
ning, pages 158–169. Springer, 2005.
[10] Tom M Mitchell. Machine learning. 1997. Burr Ridge, IL: McGraw Hill,
45:37, 1997.
[11] Alexander Pak and Patrick Paroubek. Twitter as a corpus for sentiment
analysis and opinion mining. In LREc, volume 10, pages 1320–1326,
2010.
[12] David J Hand and Keming Yu. Idiot’s bayes. International statistical
review, 69(3):385–398, 2001.
[13] Steven Bird. Nltk: the natural language toolkit. In Proceedings of the
COLING/ACL on Interactive presentation sessions, pages 69–72. Asso-
ciation for Computational Linguistics, 2006.
23
26. [14] John A Swets. Signal detection theory and ROC analysis in psychology
and diagnostics: Collected papers. Psychology Press, 2014.
[15] Andrew P Bradley. The use of the area under the roc curve in the eva-
luation of machine learning algorithms. Pattern recognition, 30(7):1145–
1159, 1997.
[16] F. Pedregosa, G. Varoquaux, A. Gramfort, V. Michel, B. Thirion, O. Gri-
sel, M. Blondel, P. Prettenhofer, R. Weiss, V. Dubourg, J. Vanderplas,
A. Passos, D. Cournapeau, M. Brucher, M. Perrot, and E. Duchesnay.
Scikit-learn: Machine learning in Python. Journal of Machine Learning
Research, 12:2825–2830, 2011.
24