Ana içeriğe atla

Veri Bilimcileri İçin Python Modülleri

Fuel
Machine Learning kullanmak için bir veri hattı framework'ü. Öncelikle bloklar, sonra yapay sinir ağlarını eğitmeye yardımcı bir araç.


agate
Makinalar yerine insanlar için optimize edilmiş bir veri analizi aracı.

Brainstorm
Bu araç yapay sinir ağları ile hızlı, esnek ve eğlenceli bir şekilde çalışmayı mümkün kılar. Tamamiyle Python ile yazılmış olup, çoklu platformlarda çalışma imkanı sunar.

TweetLake
Tweet Lake bir Twitter Streaming API komut satırı interface'i ve tweet corpus'undan ilginç durum çıkarımları yapan bir big data projesidir.

dna-traits
Hızlı 23andMe genom'u text dosya parser'ı.

borg
Sıkıştırma ve şifre doğrulama ile deduplicating yapan backup programı.

py-must-watch
js-must-watch tarafından ilham almış Python ile ilgili Must-watch videolar.

pdfx
Bir PDF'ten tüm linkleri çıkarır ve opsiyonal olarak linklerin gösterdikleri referansları download eder.

Spilo
Spill bir Highly Available PostgreSQL kümeleyicisidir (HA-cluster). Belli sayıda kümeyi biri master diğerleri slave olacak şekilde koşturur.  Amaçlanan dakikalar içerisinde konfigüre edilip başlatılabilen; çok esnek ve yüksek oranda kullanılabilir bir PostgreSQL kümeleyicisi sağlamak.

Referanslar: https://www.linkedin.com/groups/25827/25827-6065756054392684546

Yorumlar

Bu blogdaki popüler yayınlar

Adım Adım Weka Kullanımı

WEKA bir veri madenciliği uygulamasıdır ve Yeni Zellanda'daki Waikato Üniversitesi tarafından geliştirilmektedir. Bu yazının amacı WEKA Explorer'ı kullanmayı öğretmektir.


Weka ile Sınıflandırma

"Preprocessing" aşamasında veri setimizi yükledik ve eğer gerekliyse ön aşamadan geçirdikten sonra sınıflandırma aşamasına geçebiliriz. Weka nedir, Ön İşlem bölümünde neler yapılır sorusunun cevapları için önce bu yazımı okumalısınız.
SINIFLANDIRMA
Verimizi ön işlemden geçirdikten sonra artık sınıflandırabiliriz. WEKA'yı kullanarak bir çok sınıflandırıcıyı kullanabilirsiniz; Karar Ağaçları, SVM, Multi-layer Perceptrons vs. Veri setinizi yükledikten sonra Classify bölümüne tıklayarak sınıflandırma sayfasına erişebilirsiniz. Ön tanımlı ayarlara göre ZeroRalgoritması gelmektedir. Bu algoritmanın başarımı çok düşük olduğu için ben "Iris" veri seti için iyi sonuç verdiği bilinen J48 algoritması ile devam edeceğim:

Java ile Thread Pool Kullanımı

Oluşturacağımız uygulama 100 x 100 boyutlu bir matrisin içerisinde arttırma işlemi yapacaktır. Bu işlem için Runnable yada Callable sınıfı kullanılabilir. Runnable objesi olarak tanımladığımızda threadlerimiz sonlandırılana kadar sürekli olarak çalışacak ve kuyruğu sürekli olarak kontrol edip yeni bir görev olup olmadığına bakacaklardır. Thread class'ımız bize execute() adında bir method kullanım imkanı sağlamaktadır; execute(Runnable myR) şeklinde bir kullanım ile kuyruğa yeni Runnable objeler eklememize imkan sağlamaktadır.