Dersin Amacı: |
Büyük Veri Sistem Analitiği dersi, karmaşık Büyük Veri sistemlerini anlamak, analiz etmek ve optimize etmek için gereken temel kavramların ve ileri tekniklerin kapsamlı bir şekilde keşfedilmesini sağlar. Veriye dayalı karar verme ile tanımlanan bir çağda, öğrenciler ölçeklenebilir veri depolama, verimli işleme ve güçlü analitik ardışık düzenlerinin inceliklerini keşfedecekler. Teorik bilgi ve pratik alıştırmaların bir kombinasyonu yoluyla katılımcılar, sistem performansını değerlendirme, veri bütünlüğünü sağlama ve dağıtılmış bilgi işlem teknolojilerinin gücünden yararlanma konusunda uzmanlık kazanacaklar. Bu ders, Büyük Veri sistemlerinin mimarisi, dağıtılmış dosya sistemleri ve veritabanlarının arkasındaki ilkeler, akış ve toplu işleme, veri kökeni, hata toleransı ve sistem optimizasyon stratejileri gibi bir dizi konuyu kapsar. Öğrenciler, gerçek dünyadaki vaka incelemelerini inceleyerek ve uygulamalı projelere katılarak, Büyük Veri sistem tasarımının zorluklarını yönetme, veri kullanılabilirliğini sağlama ve büyük ölçekli veri kümelerinden anlamlı içgörüler elde etmek için kaynakları etkin bir şekilde kullanma konusunda güçlü bir temel geliştireceklerdir. |
Dersin İçeriği: |
Bu ders, öğrencilere Büyük Veri kavramları, teknolojileri ve analitik teknikleri hakkında derin bir anlayış sağlamak için tasarlanmıştır. Öğrenciler, ilgili araçları ve platformları kullanma konusunda uygulamalı deneyimin yanı sıra, büyük veri kümelerinden değerli iç görüleri nasıl etkili bir şekilde işleyeceklerini, analiz edeceklerini ve çıkaracaklarını öğrenecekler. |
Hafta |
Konu |
Ön Hazırlık |
1) |
Büyük Veri Sistemlerine Giriş
- Veri işleme ve depolamanın gelişimi
- Büyük Veri sistemlerinin özellikleri ve zorlukları
- Bir Büyük Veri sisteminin mimarisi ve bileşenleri |
|
2) |
Dağıtılmış Dosya Sistemleri
- Dağıtılmış dosya sistemlerinin ilkeleri (HDFS, Google Cloud Storage, Amazon S3)
- Veri çoğaltma, hata toleransı ve veri konumu
- Örnek olay: Hadoop Dağıtılmış Dosya Sistemi (HDFS) |
|
3) |
NoSQL Veritabanları ve Veri Modelleri
- NoSQL veritabanlarına genel bakış (belge, anahtar-değer, sütun-ailesi, grafik)
- CAP teoremi ve tutarlılık modelleri
- Farklı NoSQL veritabanları için kullanım örnekleri ve örnek olay incelemeleri |
|
4) |
Toplu İşleme ve MapReduce
- MapReduce paradigmasına giriş
- Anahtar kavramlar: Eşleyici, Düşürücü, Karıştırma ve Sıralama
- MapReduce işleri için optimizasyon teknikleri |
|
5) |
Akış İşleme ve Gerçek Zamanlı Analitik
- Akış işlemeyi ve önemini anlama
- Apache Kafka ve gerçek zamanlı veri işlemedeki rolü
- Örnek olay: Apache Flink ile gerçek zamanlı akışları işleme |
|
6) |
Veri Kaynağı ve Meta Veri Yönetimi
- Veri dönüşümlerini izlemek için veri soyunun önemi
- Veri kökenini ve meta veri yönetimini uygulama
- Veri kalitesinin ve izlenebilirliğinin sağlanması |
|
7) |
Hata Toleransı ve Güvenilirlik
- Dağıtılmış sistemlerdeki zorluklar: Arızalar ve arızalar
- Hata toleransı ve veri kurtarma teknikleri
- Örnek olay incelemesi: Spark uygulamalarında hata toleransı |
|
8) |
Ara Sınav |
|
9) |
Ölçeklenebilirlik ve Performans Optimizasyonu
- Büyük Veri sistemlerinde ölçeklenebilirlik hususları
- Darboğazlar ve performans optimizasyon stratejileri
- Dağıtık ortamlarda kaynak yönetimi ve zamanlama |
|
10) |
Güvenlik ve Veri Gizliliği
- Dağıtık sistemlerde veri güvenliğinin sağlanması
- Erişim kontrolü, kimlik doğrulama ve yetkilendirme
- Veri anonimleştirme ve gizliliği koruma teknikleri |
|
11) |
Bulut Tabanlı Büyük Veri Çözümleri
- Bulut tabanlı Büyük Veri mimarilerinin avantajları
- Büyük Veri işleme için yönetilen hizmetler (AWS EMR, Google Dataproc)
- Örnek olay incelemesi: Bulut tabanlı bir Büyük Veri ortamı kurma |
|
12) |
Vaka Çalışmaları ve Gerçek Dünya Uygulamaları
- Büyük Veri sistemi tasarımı ve zorluklarıyla ilgili gerçek dünya vaka incelemelerini analiz etme
- E-ticaret, sağlık, finans ve daha fazlası gibi sektörlerde kullanım örnekleri |
|
13) |
Büyük Veri Sistemlerinde Yükselen Trendler
- Edge bilgi işlem ve bunun Büyük Veri işleme üzerindeki etkisi
- Büyük Veri analitiği için sunucusuz bilgi işlem
- Veri depolama, işleme ve analitik teknolojilerindeki eğilimler |
|
14) |
Proje Çalışması ve Uygulamalı Alıştırmalar
- Büyük Veri sistemlerini kurmayı, optimize etmeyi ve analiz etmeyi içeren uygulamalı projeler
- Kurs boyunca öğrenilen kavramları pratik senaryolara uygulamak |
|
|
Dersin Program Kazanımlarına Etkisi |
Katkı Payı |
1) |
Yazılım mühendisliği, veri yönetimi ve bilgisayar güvenliği gibi temel bilgi teknolojilerindeki güncel teknik kavramları ve uygulamaları kullanma becerisi. |
|
2) |
Kullanıcı ihtiyaçlarının belirlenmesi, analiz edilmesi ve bilgisayar tabanlı sistemlerin seçiminde, değerlendirilmesinde ve yönetiminde kullanımının anlaşılması. |
|
3) |
Veri yapılarını kullanma ve algoritma geliştirme becerisi. |
|
4) |
Karmaşık büyük veri sistemlerini analiz etme ve yorumlama becerisi. |
|
5) |
Makine öğrenmesindeki kavram ve algoritmaların yorumlanması ve uygulanması becerisi. |
|
6) |
Veri analizi alanındaki derin öğrenmenin Matematik temellerinin anlaşılması ve teoriyi uygulama becerisi. |
|
7) |
Karmaşık veri yapılarını çözme, derin öğrenme modelleri geliştirme ve uygulama becerisi ve bu konularla ilgili yapay zeka odaklı araştırmaları yorumlama becerisi. |
|
8) |
Görüntü analizi, doğal dil işleme ve öneri sistemlerindeki sorunları çözmek için derin öğrenme tekniklerini uygulama ve gerçek dünya veri kümeleri ve projelerini yorumlama becerisi. |
|
9) |
Dijital sinyal işlemenin temel prensiplerini ve matematiksel altyapısını pratik uygulamalara aktarma becerisi. |
|
10) |
İnternet aracılığıyla kullanılan araç ve teknolojiler ile sunucu kodlama dilleri ve araçları için kullanılan farklı teknolojiler hakkında bilgi kazanılması. |
|
11) |
Tek hücreli organizmalarda genetik bilgi akışı ve çok hücreli organizmalarda genlerin nasıl işlediğinin anlaşılması ve biyoteknoloji alanındaki uygulamaları yorumlama ve uygulama becerisi. |
|
12) |
Etik değerlerin bilincinde olunması ve bu değerler çerçevesinde araştırma ve uygulama yapılması gerekliliğinin anlaşılması. |
|