İŞ ZEKASININ TEMELLERİ: VERİTABANLARI VE ENFORMASYON YÖNETİMİ
1. BÖLÜM 6 :İŞ ZEKASININ TEMELLERİ: VERİTABANLARI
VE ENFORMASYON YÖNETİMİ
ABDULLAH CİHAN
AKSARAY ÜNİVERSİTESİ –
YÖNETİM BİLİŞİM SİSTEMLERİ
162228001
2. GELENEKSEL DOSYA ORTAMINDA VERİLERİN
ORGANİZASYONU
Etkin bir bilgi sistemi kullanıcılarına, doğru zamanlı ve amaca uygun bilgiler
sağlar. Bazı işletmelerin doğru ve zamanlı bilgi sağlayamamalarının nedeni eski
bilgi sistemine sahip olmaları veya bilgi sistemlerindeki verilerin iyi şekilde
organize edilememesindendir.
Veri yönetiminin niçin bu kadar önemli olduğunu anlamak için geleneksel veri
yapısına bakmak gerekir.
3. DOSYA DÜZENLEME KABULLERİ
Bir bilgisayar sistemi verileri bit, bayt, alan, kayıt, dosya ve veri tabanı hiyerarşisinde
saklar.
Bit: En küçük bilgi parçacıcığını tanımlar. 8 bit bir byte oluşturur.
Bayt: Harf, sayı veya sembol gibi bir karakteri temsil eder.
Kayıt: Tablo içinde bulunan her bir satıra kayıt adı verilir.
Dosya: Aynı türden kayıtların bir araya gelmesidir.
5. Veri Tabanı: Bir grup ilişkili dosyaların bir araya gelmesiyle oluşur.
6. Geleneksel Dosya Ortamında Problemler
Veri Gereksizliği: Aynı veriler birden fazla yerde veya alanda
saklandığı için birçok veri dosyasında, tekrarlanan verilerin olması
durumudur.
Veri Tutarsızlığı: Aynı öğe parçacığının farklı değerlere sahip olması
durumudur. Bir kayda ait bir alanın bir diğer dosyada farklı değer
taşıması)
Program-veri bağımlılığı: Programdaki değişikliklerin program tarafından
erişilen veride değişiklik gerektirmesi.
Esneklik eksikliği
Zayıf güvenlik
Veri paylaşımı ve kullanılırlık eksikliği
7. VERİ YÖNETİMİNE VERİ TABANI YAKLAŞIMI
Veri tabanı teknolojisi geleneksel veri organizasyonunda çıkan problemlerin çoğunu
çözer. Veri tabanının çok dikkatlice hazırlanmış bir tanımı şudur; gereksiz verileri
kontrol ederek ve veriyi merkezileştirerek birçok uygulamaya etkili bir şekilde
hizmet etmek için organize edilmiş düzenli veri topluluğudur.
8. Veri Tabanının Avantajları
1. Çok büyük verilerin saklanabilmesi,
2. Güvenli bir ortam sunar,
3. Veri tabanları, programcılığa açık bir yapı getirmektedir,
4. Verileri kolay ulaşım
9. Veri Tabanı Yönetim Sistemleri
Uygulama programları ile fiziksel veri dosyaları arasında bir ara yüz gibi
hareket eder
Verinin fiziksel ve mantıksal görünümlerini ayırt eder
Geleneksel dosya ortamının problemlerini çözer
Gereksiz verileri kontrol altına alır
Tutarsızlığı ortadan kaldırır
Programlar ile veriyi ayırır
Örgüte, veri ve veri güvenliğini merkezi olarak yönetme imkanı sağlar
10. Popüler Veri tabanları
1. MS Access,
2. MS SQL
3. Oracle
4. MySql
5. PostgreSQL
6. Progress
7. Sybase
8. Berkeley DB
9. DB2
10. Informix
11. İlişkisel Veri Tabanı
Her bir tablo bir öğe ve onun öznitelikleri hakkında veri içerir
Her bir tablo, bir Birincil Anahtar olarak adlandırılan bir alana
sahiptir.
Yabancı anahtar: Kayıtları orijinal tablodan tanımlamak üzere
yoklama alanı olarak kullanılan ikinci tablodaki birincil alan
12. İlişkisel veri tabanında 3 temel operasyon vardır.
1-Seçim: Belirtilen kriteri taşıyan, tablodaki tüm kayıtların
bir kümesinin oluşturulmasıdır.
2-Birleştirme: Kullanıcının istediği bilgilerin ilişkisel
tablolardan alınarak birleştirilmesi işlemidir.
3-Proje: Seçilen ve birleştirilen verilerin hangi alanlarının
alınacağının belirlenerek bir yeni tabloda sunulması
işlemidir.
13. • Seçme, birleştirme ve proje faaliyetleri verinin iki farklı tablodan
toplanmasına ve sadece seçilmiş özniteliklerin gösterilmesine
olanak verir.
14. Hiyerarşik ve Ağ Veri Tabanı Yönetim Sistemi
Hiyerarşik veri tabanı yönetim sistemi modelleri bire çok ilişkiye sahip modellerdir.
Network (ağ) veri tabanı yönetim sistemleri ise çok a çok ilişkiye sahip modellerdir.
Bire Çok İlişki Tipi: İki tablo arasındaki ilişkiyi sağlayacak olan ortak alanlardan birisi
birincil anahtar diğeri yabancı anahtar ise bire çok ilişki olur.
15. Çok a Çok İlişki Tipi: Çoktan çoğa ilişikler karmaşıklığı nedeniyle veri tabanında bir
çok soruna neden oldur. A ve B tablolarının Birincil anahtarları C tablosunda aynı anda
yabancı anahtar olarak bulunuyorsa Çoka-Çok İlişki oluşur.
16. Ağ ve hiyerarşik veri tabanı yönetim sistemi, İlişkisel veri tabanı yönetim sisteminden
daha az esnek ve sorgulamada doğal dil yapısını kullanmadığı gibi anlık sorgulamaları
da desteklememektedir.
İlişkisel veri tabanı yönetim sistemi anlık sorgulamalarda, farklı kaynaklardan gelen
bilgileri birleştirmede, mevcut programları ve uygulamaları değiştirmeden yeni veriler
ve kayıtlar eklemeye izin vermede çok esnektir. Bununla birlikte bu sistemler bir anda
birçok bağlantı yapılması ve sorgulama komutu gönderilmesi durumunda yavaş
çalışırlar.
17. Nesneye Yönelik Veri Tabanı Yönetim Sistemi
Bugün çoğu uygulamalar sadece metin ve sayısal karakterlerin saklanmasını
gerektirmemekte aynı zamanda resim, ses, video, grafik gibi nesneleri de
gerektirmektedir. Veri tabanı yönetim sistemi, satır ve sütun yapısında
tasarlandığından grafik tabanlı multimedya uygulamalarının işlenmesi için çok iyi
değildir. Nesneye yönelik veri tabanı yönetim sistemi bu durum için iyi bir çözüm
olabilir.
18. Nesneye yönelik veri tabanı yönetim sistemi giderek popüler olmaya başlamıştır Çünkü
web uygulamaları, Java nesnelerini kullanabilmektedir.
Nesneye yönelik veri tabanı yönetim sistemi ilişkisel veri tabanından daha karmaşık
bilgiler saklayabilmesine rağmen çok sayıda işlemi veya kaydı işlemeleri ilişkisel veri
tabanı yönetim sistemlerine göre daha yavaştır.
Hybrid nesne tabanlı veri tabanı yönetim sistemleri hem ilişkisel hem de Nesneye
yönelik veri tabanı yönetim sistemlerinin yeteneklerini ve imkanlarını
sağlayabilmektedir.
19. Veri tabanı Yönetim Sistemlerinin Yetenekleri
Veri tanımlama yeteneği: Veri tabanı tabloları oluşturur ve her tablodaki alanların
özelliklerini tanımlamak için kullanılır
Veri sözlüğü: Veri unsurlarının tanımlarını veya onların özelliklerini depolayan otomatik
veya kullanıcı tarafından girilen bir dosya.
Veri işleme dili: Veriyi eklemek, değiştirmek, silmek, veriyi veri tabanınından geri almak
için kullanılır
Bugün en önemli veri işleme dili Yapısal Sorgulama Dili olan SQL’dir.
Örnek bir SQL sorgusu :
select * from Ogr_adi where Adi='ali' or soyadi='orhan';
20. Veri Tabanlarının Tasarımı
Veri tabanı hem kavramsal tasarım hem de fiziksel tasarım aşamalarını
gerektirir.
Kavramsal veya mantıksal tasarım: İşletme bakış açısından verilere bir
soyut bakış açısını gösterir.
Veri tabanını fiziksel tasarımı ise saklama aygıtlarında verinin gerçekten
nasıl saklanacağının tasarlanmasıdır
21. Normalizasyon ve Öğe İlişkiler Diyagramları
Karmaşık veri gruplarından uyarlanabilir, esnek, düzenli veri yapıları ve
küçük tablolar oluşturma işine Normalizasyon denir.
22. Bir işletme veri tabanı modelini doğru oluşturamazsa, sistem işletmeye iyi
hizmet
etmeyecektir. Güncel olmayan tutarsız verilerle çalışmak işletmeye zarar
verecektir.
23. Dağıtılmış Veri Tabanları
Dağıtılmış Veri Tabanı fiziksel olarak birden fazla yerde saklanan veri
tabanıdır. Dağıtılmış veri tabanlarında iki temel metot vardır. Bölümlere
ayrılmış veri tabanı: Bu modelde veri tabanının bir parçası fiziksel olarak
bir yerde diğer parçası ise bir diğer yerde saklanır ve kullanılır. Yerel veri
tabanlarındaki değişiklikler genellikle gece toplu işleme ile merkezi veri
tabanına eklenerek bütünlük sağlanır.
Çoğaltılmış Veri tabanı: Merkezi veri tabanı başka bir noktada ikinci kez
çoğaltılır.
24. İŞLETME PERFORMANSINI VE KARAR VERMEYİ
GELİŞTİRMEK İÇİN VERİ TABANI KULLANMAK
İşletmeler, tedarikçilere ödemeler, siparişlerin alınması, müşterilerin
izlenmesi, çalışanlara yapılan ödemelere gibi temel işlemlerini izlemek
için kendi veri tabanlarını kullanırlar.
Veri tabanları ayrıca yöneticilerin ve çalışanların daha iyi karar
verebilmeleri ve işletmenin daha etkili olabilmesi için de bilgi sağlar. Bir
işletme hangi ürünün daha çok popüler veya hangi müşterinin daha karlı
olduğunu bilmek isterse bu bilgileri veri tabanından bulabilir.
25. Veri Ambarları Nedir?
Bir Veri Ambarı işletmenin tümünü ilgilendiren çapta, karar vericilerin
ilgi alanlarına yönelik güncel ve geçmiş verileri saklayan büyük veri
tabanlarıdır. Veriler satış ve pazarlama, müşteri hesapları, üretim gibi
temel işlemsel sistemlerden çıkmaktadır ve web sitesi işlemlerini de
içerebilir. Veri Ambarları, yönetimin analiz yapabilmesi ve karar
verebilmesi için bilgiyi farklı veri kaynaklarından sağlayarak birleştirir ve
standartlaştırır.
26. Bir veri ambarı, veriyi ihtiyaç duyan herkesin erişebilmesi için hazırlar, fakat veriler
değiştirilemez. Bir veri ambarı sistemi, anlık standartlaştırılmış sorgulama araçları,
analitik araçlar ve grafik raporlama için geliştirilmiş araçlar sağlar. Birçok işletme,
işletmenin tümünde verilerin erişilebilir olması için intranet portalları kullanır.
27. Veri Martları(Veri Pazarları)
Veri ambarının altkümesidir
Özel bir kullanıcı kitlesi tarafından kullanılan özetlenmiş ve oldukça odaklanmış işletme
verisidir.
Örneğin, bir işletme müşteri bilgileri ile ilgili olarak bir satış ve pazarlama veri pazarı
geliştirebilir. Bir veri pazarı tipik olarak belirli tek bir konuya veya bir iş alanına
yöneliktir. Bu yüzden genellikle çok hızlı oluşturulabilirler ve veri ambarlarından daha
ucuza mal olurlar.
28. İşletme Zekası, Çok Boyutlu Veri Analizleri ve
Veri Madenciliği
İş Zekası: Kullanıcıların daha iyi kararlar vermesine yardımcı olmak için
büyük miktardaki veriyi birleştiren, analiz eden ve erişime açan araçlardır.
Temel araçlar:
Veri tabanı sorgulama ve raporlama yazılımı
Online analitik işleme (Online analytical processing, OLAP)
Veri madenciliği
30. Online Analitik İşleme (OLAP)
İşletmeler genellikle farklı ürünleri farklı pazarlarda satarlar. Hangi
ürünün geçmişte hangi pazarlarda ne kadar satıldığını öğrenmek için veri
tabanı kullanılır. Ancak hangi ürünün hangi bölgede ne kadar satıldığının,
satış hedefleri ile karşılaştırılması bilinmek istenirse?
Bunun cevabını almak için Online Analitik İşleme (OLAP)’ye ihtiyaç
vardır.
Online Analitik İşleme; farklı boyutlar kullanarak, aynı verilerin farklı
şekillerde kullanıcılara gösterilmesi sağlayan çok boyutlu veri analizlerini
destekler. Bilginin fiyat, bölge gibi her bir yönü farklı bir boyutu gösterir.
31. Şekil, ürün-bölge karşıtlığıdır.
Küpü 90 derece döndürürseniz
yüz, ürün karşısında güncel ve
tahmini satışları gösterecektir.
Eğer küpü tekrar 90 derece
döndürürseniz bölge karşısında
güncel ve tahmini satışları
göreceksiniz. Başka görüntüler
de elde etmek mümkündür.
32. Veri Madenciliği
Veri Madenciliği daha çok keşif amaçlıdır.
Veri madenciliği; büyük veri tabanlarında gizli örüntüler ve ilişkiler bulmakla ve
gelecekteki davranışları tahmin etmek için kurallar çıkarmakla OLAP ile elde
edilemeyen bilgileri sağlar.
Bu kurallar ve örüntüler karar alma ve tahminde bulunmak için kullanılır.
Veri madenciliğinden elde edilen bilgilerin türleri;
Birleşme: Örneğin; bir süpermarket alış veriş örüntüsü çalışması, mısır cipsi alanların
yanında kolalı bir içecek de alması oranı %65, fakat promosyon varsa kolalı içecek
alınma oranı %85 olmasını ortaya koyabilir. Bu bilgi promosyonun karlılığı nasıl
arttırdığı konusunda yöneticilere bir fikir verebilir.
33. Ardışıklık: Bir ürünü alanın bir süre sonra başka bir ürünü alması durumu.
Örneğin; bir ev satın alınırsa, iki hafta içinde %65 olasılıkla, bir ay içinde ise
%45 olasılıkla yeni bir buzdolabı alınacaktır.
Sınıflandırma: mevcut verilerin incelenmesiyle belirli bir kurallar kümesi veya
sınıflandırma çıkarımı oluşturulmasını sağlar. Örneğin; kredi kart ve telefon
şirketleri gibi şirketler sürekli müşteri kaybetmekten endişelidirler. Bu
sınıflandırma, ayrılan müşterilerin profillerini bulmaya ve bu müşterileri tahmin
etmeye ve böyle müşterileri şirkette tutabilmek için özel promosyon planlamasına
yardım edebilir
34. Kümeleme: davranış olarak birbirine benzeyen ancak ayrı özelliklere sahip
grupları ortaya çıkarmak için kullanılır.
Tahmin: gelecekte olabilecekleri tahmin etmek için var olan değerler setini
kullanır. Geçmiş satış verilerinden gelecekteki satış tahminlerine ulaşmak
gibi.
35. VERİ KAYNAKLARINI YÖNETMEK
Bir veri tabanı kurmak sadece bir başlangıçtır. İşletme, verilerinin güncel,
sürekli hazır, güvenilir ve bilgiye ihtiyaç duyanlar için her an hazır
olduğundan emin olmak için veri yönetiminde bazı özel politika ve
prosedürlerinin olması gerekir.
36. Bir Bilgi Politikası Oluşturmak
Bilgi Politikası, işletmenin bilgi toplaması, sınıflandırılması,
standartlaştırılması, dağıtılması ve paylaşılması için kuralları belirler. Bir
bilgi politikası, bilgiyi kimlerin ve hangi organizasyonel birimlerin
paylaşacağını, bilginin nerelere dağıtılacağını, bilginin güncellenmesinden
ve sürdürülebilmesinden kimin sorumlu olduğunu belirleyen, belirli
prosedürleri düzenler.
37. Küçük bir işletme de işletmenin sahibi veya yönetici tarafından bilgi politikası
oluşturulabilir.
Büyük işletmelerde ise kurumsal bir kaynak olan bilginin planlanması ve yönetilmesi
için genellikle yapısal bir yönetim fonksiyonu gerekir.
Doğru olmayan, eksik ve tutarsız veri, işletmeler için büyük işlemsel kayıplar ve finansal
zararlar doğurur. Bu tür bilgiler yanlış fiyatlandırma, müşteri hesaplarının karıştırılması,
işletmenin alması gereken kararlarda tutarsızlık ve yanlışlıklara neden olabilir. Bu
nedenle işletmeler, yüksek düzeyde veri kalitesi sağlamak için bazı özel adımlar
atmalıdır. Bu adımlar; kurumsal genişlikte veri standartları kullanmayı, veri temizleme
araçları kullanılarak ve veri kalitesi izlemesi yaparak veri tabanını tutarsız bilgi ve yanlış
bilgilerden ayıklamayı içerir.
Notes de l'éditeur
Sınıflandırma: Grup sayısı ve karakteristiği bellidir. Yeni gelen üyenin hangi sınıfa ait olduğuna karar verilerek, o sınıfa eklenir. Elimizde N tane üye ve M tane sınıf olduğunu düşünürsek, bu N tane üyeyi, M tane sabit sınıftan en çok benziyenin içersine yerleştirmeye çalışırız.
Kümeleme: Grup sayısı ve karakteristiği belli değildir. Üyeler özelliklerine bakılarak yeni sınıflar oluşturulur. Ayrıca sınıf sayısını sabit olarak belirleyebiliriz, ya da sınıf sayısı değişkenlik de gösterebilir.