Skip to content

Developer-MultiGroup/DMG-Data-Science-Awesome

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

67 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

DMG Data Science Awesome

Awesome Made With Love License: MIT GitHub pull-requests

GitHub stars GitHub forks GitHub watchers

DevMultiGroupBanner

Ekibimizi ve üzerinde çalıştığımız işleri daha yakından inceleyin 👉 MultiGroup.hq

aiconf

Online serimiz olan "DataCommit" etkinliğimize katılın. Data expertler ile soru-cevap fırsatını yakalayın. Herkes davetlidir. Ücretsiz biletler için 👉 DataCommit

📌 DataCommit Kaynaklar

DataCommit'te önerilen kaynaklara erişmek için 👉 DataCommit

👋 Kaynak arşivine katkı sağlamadan önce lütfen Contribution Guide'a göz atınız.

LinkedIn Twitter Follow Share on X Share on LinkedIn

🌟 Alanlar ve Sorumlu Kişiler

🐍 Python & SQL 📈 Machine Learning 📝 Natural Language Processing
📊 Data Science 🚀 MLOps & Cloud 🤖 GenerativeAI
Selin Çıldam Göker Güner Enes Fehmi Manan

📑Table of Contents

🗂️ Structured 🧠 Unstructured
🐍 Python & SQL 🤖 GenerativeAI
📊 Data Science 📝 Natural Language Processing
📈 Machine Learning 🧬 Deep Learning
📚 Data Books 👁️ Computer Vision
📰 Data Papers 🚀 MLOps & Cloud

🐍Python & SQL

Click to expand!

^ back to top ^

SQL

Python

🔗 Useful Links

📊Data Science

Click to expand!

^ back to top ^

🔗 Useful Links

  • Veri Defteri - Veri Biliminin bir çok konusu hakkında hem blog hem video tutorialları olan websitesi.
  • Yapay Zekâ Araştırma İnisiyatifi - Derin öğrenme konusunda birçok iyi kaynağın çevrilmiş hallerinin derlendiği websitesi.
  • Data Science Roadmap - Veri bilimi için temel öğrenilmesi gereken konseptleri gösteren akış diyagramı.

Introduction to Data Science

Exploratory Data Analysis

Data Wrangling & Preprocessing

📈Machine Learning

Click to expand!

^ back to top ^

Courses

  • Makine Öğrenmesine Giriş - ML teorisini detaylı bir şekilde öğrenin. Ders kaynaklarına buradan erişebilirsiniz.
  • AI for Beginners - Microsoft tarafından yayınlanan AI kursu.
  • Google ML Crash Course: Google'ın ML üzerine kapsamlı temel bir kursu, pek çok ML kavramına dair temel bilgi edinmek ve kariyerine sağlam başlangıç noktaları oluşturmak isteyenler için.
  • Coursera ML Specialization: Coursera'nın toplam 4 kurstan oluşan ML Uzmanlık serisi. Teorik bilginin yanı sıra notebook ödevleriyle birlikte ML kodlama pratiğine başlamak isteyenler için.
  • Kaggle Intro to ML: Kaggle'ın temel seviye ML kursu. Basit seviyede konseptler, tanımlar içerir.
  • Kaggle Intermediate ML: Kaggle'ın giriş seviye kursunun devamı niteliğinde, yine de seviyesi çok üst düzey değil. Başlangıç seviyesinde olanların da rahatlıkla takip edebilecekleri bir kurs.
  • DataTalksClub ML Zoomcamp: DataTalksClub'ın ML Zoomcamp'i. İçerikleri kendi hızınızda tüketebilirsiniz ancak, yılın belli dönemlerinde Zoom üzerinden dersler, ödevler vb. şeklinde de takip edilen "Zoomcamp"leri mevcut.

📖 Blog Tutorials

  • Supervised Learning: Stanford'un CS229: Machine Learning dersine ait Türkçeye çevrilmiş Gözetimli öğrenme notları.
  • Unsupervised Learning: Stanford'un CS229: Machine Learning dersine ait Türkçeye çevrilmiş Gözetimsiz öğrenme notları.
  • What is Overfitting?: Overfitting kavramını ve kaçınmanın yollarını öğrenin.
  • Scikit Learn Official Document: Temel algoritmalar, preprocess yöntemleri, model başarı ölçümlemeleri gibi Machine Learning'e ait neredeyse bütün konseptler için Python dilinde kullanabileceğiniz scikit-learn'ün resmi dokümantasyonu.
  • Machine Learning Basics - Makine öğrenmesi algoritmalarının hem teorisini hem pratiğini notebooklar üzerinden adım adım implemantasyonuyla birlikte veren repo.

📹 Video Tutorials

🗃️ Datasets

  • UCI ML Repository: UC Irvine üniversitesine ait veri setleri. Kendi kütüphanesi ile direkt olarak python projesinin içerisine import edebiliyorsunuz.
  • Kaggle Datasets: Kaggle platformundaki veri setleri. Giriş seviyesi kurslardan sonra hangi alanda hangi veri türüyle çalışmak istediğine karar verme aşamasında mutlaka göz atılmalı.
  • Awesome Repo: Başlangıç seviyesi küçük veri setlerinin ardından daha büyük projeler çıkarmak isteyenler için daha gelişmiş veri setlerinin olduğu bir repo. Bu repoda ilgi alanlarınıza göre ayrılmış başka alanlardaki veri setlerini de görebilirsiniz.

📚Data Books

^ back to top ^

Data alanında yazılmış yerli ve yabancı kitapların listesini görmek için tıklayınız.

📰Data Papers

^ back to top ^

Data alanında yazılmış yerli ve yabancı makalelerin listesini görmek için tıklayınız.

🤖Generative AI

Click to expand!

^ back to top ^

🔗 Useful Links

📹 Video Tutorials

📖 Blog Tutorials

🔧 Framework

  • Transformers - Hugging Face tarafından geliştirilen, NLP ve generative AI modellerini kolayca kullanmanızı sağlayan bir kütüphane.
  • LangChain - Büyük dil modelleri (LLM) ile çalışma ve uygulama geliştirme sürecini kolaylaştıran bir framework.
  • Haystack - Büyük dil modellerini orkestre ederek farklı kullanım alanlarında (RAG, AI Agent'ları vs.) uygulama geliştirmenizi sağlayan açık kaynak bir framework.
  • co:here - Cohere, gelişmiş Büyük Dil Modelleri ve NLP araçlarına erişim sağlar.
  • Ollama - Büyük dil modellerini yerel olarak çalıştırmanızı sağlayan bir framework.
  • DeepSpeed - Microsoft tarafından geliştirilen, büyük modellerin daha verimli bir şekilde eğitilmesi ve kullanılması için optimize edilmiş bir deep learning optimizasyon kütüphanesi.
  • Alpaca-LoRA - LLaMA tabanlı modeller üzerinde düşük kaynakla hızlı ince ayar (fine-tuning) yapmayı sağlayan bir framework.
  • Fairseq - Facebook AI tarafından geliştirilen, çeşitli NLP ve sıralı modelleme görevleri için kullanılan bir framework.
  • Letta - Eskiden MemGPT iken şu an isim değiştirilerek sunulan yeni bir framework.

Models

  • OpenAI - OpenAI'nin API'si, çeşitli doğal dil görevlerini yerine getiren GPT-3 ve GPT-4 modellerine ve doğal dili koda çeviren Codex'e erişim sağlar.
  • LLaMA - Meta tarafından geliştirilen, 65 milyar parametreli temel bir büyük dil modeli.
  • deepseek - Açık kaynak olarak geliştirilen, oldukça başarılı yanıtlar üreten LLM.
  • Claude - Anthropic tarafından geliştirilen bir yapay zeka asistanı olan Claude ile konuşun.
  • Mixtral - Açık ağırlıklara sahip "sparse mixture of experts" mimarisiyle yüksek kaliteli ve verimli doğal dil işleme çözümleri sunan bir model.
  • Grok - xAI tarafından geliştirilen ve açık kaynak ve açık ağırlıklara sahip bir büyük dil modeli.
  • 🛠️ Coding Assistants
    • GitHub Copilot - GitHub Copilot, OpenAI Codex desteğiyle editörünüzde gerçek zamanlı kod ve fonksiyon önerileri sunar.
    • Amazon Q - AWS’nin yapay zeka destekli asistanı; soruları yanıtlar, kod yazar ve görevleri otomatikleştirir.

📝Natural Language Processing

Click to expand!

^ back to top ^

🔗 Useful Links

📹 Video Tutorials

📖 Blog Tutorials

🧬Deep Learning

Click to expand!

^ back to top ^

👁️Computer Vision

Click to expand!

^ back to top ^

📹 Video Tutorials

🚀MLOps & Cloud

Click to expand!

^ back to top ^

MLOps

Courses

  • MLOps Zoomcamp - DataTalksClub isimli topluluğun MLOps Zoocamp'i. Self-paced, ama dönem dönem online canlı derslerle dünyanın her yerinden katılımcılarla da senkron bir şekilde ödevli takipli alabiliyorsunuz kursu. Aynı repodan topluluğun web sitesine gidip diğer kursları inceleyebilir ve topluluğa özel kanallara da katılabilirsiniz.

Blogs

  • Marvelous MLOps - MLOps'a dair takip edilesi bir blog, aynı isimli bir Linkedin sayfaları da var, orada daha aktifler.

Video Tutorials

  • TechWorld With Nana - Devops bilmeden MLOps eksik kalır, bu Youtube kanalı devops için bulabileceğimiz en iyi kaynaklardan.

Cloud

Blogs

  • ☕☕Google Vertex AI - Google'ın AI platformu Vertex AI'ın dokümanı. Cloud'a dair pek çok doküman&kaynak bulunabilir elbette ama öğrenmenin en iyi yolu kesinlikle orjinal dokümanları incelemek.

  • ☕☕AWS Bedrock Samples - AWS Bedrock örneklerini içeren repo.

✨ DataCommit

Click to expand!

^ back to top ^

Books:

  • Probabilistic Machine Learning: An Introduction - Kevin Murphy - Matematiği seviyorsanız ve ML'in temellerini öğrenmek istiyorsanız, güzel bir başlangıç.

  • ☕☕ Probabilistic Machine Learning: Advanced Topics - Kevin Murphy - Matematiği seviyorsanız ve ML temeliniz varsa, bunu daha ileriye taşımak istiyorsanız göz atabilirsiniz.

Reddit:

  • Leetcode - FAANG mülakatları ile ilgili deneyimleri okuyabilirsiniz.

  • Cscareerquestions - Genel CS ilgili soru-cevapların olduğu bir yer.

  • MachineLearning - Genel olarak ML ile ilgili ilginç başlıklar bulabilirsiniz.

  • LocalLLaMa - Yeni çıkan LLM'lerin yorumlarına ulaşabilirsiniz.

  • EngineeringResumes - CV değerlendirmeleri bulabilirsiniz.

  • Programming - Can sıkıntısında dolaşmak için :)

YouTube:

  • Ritvikmath - Genel Data Science konseptlerini anlamak için güzel bir kanal.

  • 3blue1brown - Animasyonlu ilginç konu anlatımları bulabilirsiniz.

  • DataTalks.Club - Data alanında ünlü insanları konuk eden bir podcast
  • AI News by Smol AI - Önde gelen araçlarının discord sunucularında, popüler subredditlerde, sosyal medyada olan AI ile alakalı haberleri derleyen günlük bülten
  • Lu.Ma Istanbul - kommunity.com veya meetup gibi platformların alternatifi, AI/ML de dahil olmak üzere başka etkinlikleri de takip edebileceğiniz takvim
  • Hype - Github, Hugging Face, Replicate ve Reddit'te trend olan ML projelerini günlük olarak sıralayan bir site :)
  • ☕☕ AlphaSignal - ML ürün ve araştırmalarından son haberleri almak için güzel bir haber bülteni
  • DataCamp - Hem programlama hem veri bilimi, veri mühendisliği için kısa süreli kursları ve kendi online kod editörü olan bir site, ücretli ama uygun fiyatları var.
  • Devpost - Global çaptaki hackathonlara ulaşabileceğiniz ve katılım sağlayabileceğiniz bir site
  • Kaggle - Kariyer başlangıcı için öncelikle hangi veri alanında çalışmak istediğimize karar vermemiz gerekiyor demiştik. Veri tiplerini ve yapabileceklerimizi tanımak için.

  • Huggingface - Kaggle'a biraz aşina olduktan sonra Generative AI alanında da güncel kalmak, elimizi kirletmek için.

  • Türkiye Yapay Zeka İnsiyatifi - Kariyerimizin ilk İş/Staj deneyimi için çok faydasını gördüğüm, kendinizi geliştirmenin en iyi yollarından biri olarak startup deneyimi edinebileceğiniz şirketleri listeleyen platform.

  • Feeder - Teknoloji şirketlerinin bloglarını derli toplu takip etmek için kullandığım RSS Feeder uygulaması.

  • Twitter AI listem - Sosyal medyayı iyi kullanmak için Medium, Linkedin platformlarının yanı sıra X'i de verimli kullanabileceğimizden bahsettik. Yapay Zeka için bir X listem var. Bu listeyi takip ettikten sonra "Listeler" bölümüne gelip sağındaki raptiye sembolüne tıklayarak listeyi sabitleyebilir, ana sayfanızda "Sana Özel" ve "Takip Edilenler" akışlarının sağında bu listenin tweetlerini de ayrı bir akış olarak görebilirsiniz. Ara ara kendi beğenilerime, ilgilerime göre güncelliyorum bu listeyi.

  • DataTalks.Club - MLOps alanını biraz tanımak için Alexey Grigorev'in DataTalksClub topluluğunu ve MLOps Zoomcamp'ini tavsiye ediyorum.

  • Perplexity & Cursor - Arama motoru olarak Perplexity'nin free sürümünü, kod asistanı olarak da aktif kullanmasam da Cursor'u tavsiye edebilirim.

Takip ettiğim, Yapay Zeka alanında mail bülteni sunan platformlar


🌟 Contributors

awesome contributors

Star History Chart