Graphite aracılığı ile Grafana'da Apache SPARK ve Hadoop Monitoring

nurhaksenturk

Nurhak Şentürk

Posted on June 21, 2023

Graphite aracılığı ile Grafana'da Apache SPARK ve Hadoop Monitoring

Bu yazının amacı,Apache Spark ve Hadoop metriklerini kaynak kabul edip, bu verilerin Grafana ortamında görselleştirilmesini sağlamaktır.Bu nedenle ismi geçen uygulamalar ile ilgili kısa bilgi verip, yapmak istediğimiz ana konuya odaklanmak istiyorum.Tüm adımlar standart(monolitik) mimari ile kurgulanmıştır.

Grafana: Desteklenen veri kaynaklarından metrik verileri girdi olarak sağladığımızda analitik ve etkileşimli görseller oluşturabileceğimiz açık kaynak kodlu bir uygulamadır.

Graphite: Metrik verilerin toplanması, depolanması, görselleştirilmesi ve analiz edilmesi için kullanılan bir açık kaynaklı yazılım platformudur. Genellikle sistem performansı, ağ izleme, uygulama izleme ve zaman serisi verilerinin analizi gibi alanlarda kullanılır. Graphite, metrik verilerini çeşitli kaynaklardan alabilir, ölçeklenebilirlik sağlayabilir ve esnek bir şekilde özelleştirilebilir. Aynı zamanda Grafana, Kibana gibi diğer araçlarla da entegre edilebilir. Bu sayede, sistemlerinizi izlemek, performansı analiz etmek ve trendleri görselleştirmek için kullanabileceğiniz güçlü bir araçtır.

Apache SPARK: Büyük veri işleme ve analizi için hızlı ve genel amaçlı bir açık kaynak kodlu veri işleme motorudur. Spark, yüksek hızda paralel veri işleme yapabilen dağıtık sistemler üzerinde çalışır. Yoğun veriye sahip uygulamarda veriyi hızlı bir şekilde işleyebilir.

Hadoop: Büyük miktardaki verilerin depolanması ve işlenmesi için kullanılan bir açık kaynaklı yazılım çerçevesidir. Hadoop, ölçeklenebilir, dağıtık bir sistem üzerinde çalışır ve birçok düşük maliyetli bilgisayar düğümünden oluşan bir küme üzerinde veri işleme işlerini gerçekleştirir.

Kurulumlar Ubuntu 22.04 ortamlarında yapılmıştır. Ayrıca kullanılan sunucunun(sunucuların) üzerindeki firewall servisi kapalı konumda olmalıdır. Aksi halde firewall kurallarını yazmanız gerekebilir.

GRAFANA KURULUMU

Öncelikle Ubuntu sistemimizin güncel olduğundan emin oluyoruz.

sudo apt update && sudo apt upgrade
Enter fullscreen mode Exit fullscreen mode

İmzalı paketleri kurmak amacıyla Grafana gpg anahtarını ekliyoruz.

sudo apt install -y gnupg2 curl software-properties-common
curl -fsSL https://packages.grafana.com/gpg.key|sudo gpg --dearmor -o /etc/apt/trusted.gpg.d/grafana.gpg
Enter fullscreen mode Exit fullscreen mode

Grafana APT repository'sini depo tanımlarımız arasına ekliyoruz.

sudo add-apt-repository "deb https://packages.grafana.com/oss/deb stable main"
Enter fullscreen mode Exit fullscreen mode

APT repository'sini ekledikten sonra kullanılan paket veritabanları güncelleyip ve Grafana kurulumu yapıyoruz.

sudo apt update 
sudo apt -y install grafana
Enter fullscreen mode Exit fullscreen mode

Grafana servisini başlangıçta otomatik olarak başlatılacak şekilde yapılandırmak ve başlatmak için aşağıdaki komutu çalıştırıyoruz.

sudo systemctl enable --now grafana-server
Enter fullscreen mode Exit fullscreen mode

Bu şekilde Grafana kurulumunu tamamlamış oluyoruz. Grafanaya erişim için arayüzlü bir istemcinin Web Browser'una Grafana kurulumu yaptığımız Ubuntu 22.04 sunucunun IP adresini yazarak sonuna port bilgisi olarak :3000 ekliyoruz.

UBUNTU_SERVER_IP_ADRES:3000
Enter fullscreen mode Exit fullscreen mode

Kurduğumuz Grafana sunucusunun default kullanıcı adı:admin, parola:admin şeklindedir. İlk girişte sizden yeni bir parola oluşturmanız beklenmektedir. Bu adımı atlama seçeneği de mevcuttur.

Grafanayı kurduktan sonra ortamınızın değişkenleri doğrultusunda isterseniz aynı sunucu üzerinde isterseniz farklı bir sunucuda Graphite kurulumlarına başlayabilirsiniz. Ben aynı sunucu üzerinde devam edeceğim.

GRAPHITE KURULUM VE KONFIGURASYONU

Farklı bir zamanda kuruluma devam edilebileceği veya farklı bir sunucu üzerinden devam edilebileceği için yine ilk olarak Ubuntu sistemimizin güncel olduğundan emin oluyoruz.

 sudo apt-get update && sudo apt-get upgrade
Enter fullscreen mode Exit fullscreen mode

Paketlerin depoda olduğunu ve sürüm bilgilerini görüntülemek amacıyla aşağıdaki komutlar çalıştırılabilir.Bu komutların kuruluma doğrudan bir etkisi yoktur.

sudo apt-cache search graphite | grep "graphite-"
sudo apt-cache madison graphite-carbon graphite-web
Enter fullscreen mode Exit fullscreen mode

Paket kurulumları yapıyoruz.

sudo apt-get install graphite-carbon graphite-web
Enter fullscreen mode Exit fullscreen mode

Bu aşamadan sonra Graphite uygulamasının konfigurasyonlarını yapmaya başlıyoruz.Graphite Carbon uygulamasına ait yapılandırma dosyasının ve diğer yapılandırma ayarlarını görüntülemek için aşağıdaki komutu çalıştırıyoruz.

cat /etc/carbon/carbon.conf | egrep -v '#' | sed '/^$/d'
Enter fullscreen mode Exit fullscreen mode

Sunucun veya servislerin yeniden başlaması durumunda carbon-cache.py servisinin yeniden başlaması için aşağıdaki düzenlemeyi yapıyoruz.Bu adım kurulumun devamı açısından zorunlu değildir.

sudo vim /etc/default/graphite-carbon
# Change to true, to enable carbon-cache on boot
CARBON_CACHE_ENABLED=true  ## Ihtiyac duyulmasi haline "true" yapilabilir.
Enter fullscreen mode Exit fullscreen mode

Dosyayı kaydetip kapattıktan sonra servis yeniden başlatılır.

sudo systemctl start carbon-cache
sudo systemctl status carbon-cache
Enter fullscreen mode Exit fullscreen mode

Paket kurulumu sırasında bağımlılıklardan bir tanesi SQLite Veritabanıdır. Graphite uygulaması bir veritabanına ihtiyaç duyar.Uygulama geniş bir altyapıda cluster kullanılacaksa PostgreSQL veya MySQL kullanılabilir. Biz default yapı üzerinden yani SQLite üzerinden kuruluma devam edeceğiz. Bu aşamada Graphite uygulamasının veritabanı oluşturma ve SQL ayarlarını yapıyoruz.

sudo django-admin migrate --settings=graphite.settings
Enter fullscreen mode Exit fullscreen mode

SQLite veritabanı dosyasının sahipliğini, veritabanı işlemlerini çalıştırmak için kullanılacak olan _graphite kullanıcısına yeniden atıyoruz.

sudo chown _graphite:_graphite /var/lib/graphite/graphite.db
Enter fullscreen mode Exit fullscreen mode

Graphite uygulamasının Web konfigurasyonlarını düzenliyoruz. Default olarak oluşturulmuş anahtarı kendi belirlediğimiz bir anahtar ile değiştiriyoruz.

sudo vim /etc/graphite/local_settings.py
...
SECRET_KEY = 'MY_SECRET' # kendi anahtarimizi giriyoruz.
Enter fullscreen mode Exit fullscreen mode

Graphite Web kurulum dizinini düzenlemek için sembolik link oluşturuyoruz.

sudo ln -s /etc/graphite/local_settings.py /usr/lib/python3/dist-packages/graphite/local_settings.py
Enter fullscreen mode Exit fullscreen mode

Graphite uygulamasının arayüzünün görüntülenmesi için bir web sunucusuna ihtiyaç duyar. Bu birkaç farklı şekilde yapılabilir. Biz bu kılavuz için “Apache + mod_wsgi” yığınını kullanacağız.
Apache kurulumu ve konfigurasyonu için şu adımlar takip edilmelidir.

sudo apt-get install apache2 libapache2-mod-wsgi-py3

sudo cp /usr/share/graphite-web/apache2-graphite.conf /etc/apache2/sites-available

sudo a2dissite 000-default

sudo a2ensite apache2-graphite

sudo systemctl reload apache2 

sudo chown _graphite:_graphite /var/log/graphite/info.log

sudo chown _graphite:_graphite /var/log/graphite/exception.log

sudo systemctl reload apache2 
Enter fullscreen mode Exit fullscreen mode

Bu adımdan sonra Web Browser'dan Graphite sunucusunun bulunduğu sununun IP'sine istek attığımız zaman arayüze erişimin açık olması gerekmekte. Fakat Apache'nin loglarını incelediğimiz zaman bir hata göreceğiz.

tail -f  /var/log/apache2/graphite-web_error.log
Enter fullscreen mode Exit fullscreen mode

Bu hatanın çözümü için aşağıdaki adım uygulanabilir.

sudo vi /etc/apache2/sites-available/apache2-graphite.conf
...
        WSGIProcessGroup _graphite
        WSGIApplicationGroup %{GLOBAL}     ## Bu satır eklenecek. 
        WSGIImportScript /usr/share/graphite-web/graphite.wsgi process-group=_graphite application-group=%{GLOBAL}
...

sudo systemctl reload apache2
Enter fullscreen mode Exit fullscreen mode

Bu adımdan sonra loga tekrar baktığımızda hata olmadığını göreceğiz.

tail -f  /var/log/apache2/graphite-web_error.log -c 0
Enter fullscreen mode Exit fullscreen mode

Bu adımla birlikte Web Sunucusu kurulumunu tamamlamış olduk.Şimdiye kadar Graphite'i metrikleri görüntülemek için yapılandırmıştık, ancak grafikleri kaydetmek veya panolar oluşturmak için kullanacak yapıyı oluşturmadık. Sıradan kullanıcıları ekleyebilmemiz ve daha gelişmiş işlemler yapabilmemiz için önce bir Graphite admin kullanıcısı oluşturmamız gerekiyor.

sudo django-admin createsuperuser --settings=graphite.settings
Enter fullscreen mode Exit fullscreen mode

Default yapıda admin sayfası Grapite Web sunucu ayarlarından farklı olarak Django Admin Dashboard'undan erişilmektedir.Bu sebeple bir sembolik link oluşturarak bu sorunu da çözüyoruz.

sudo ln -s /usr/lib/python3/dist-packages/django/contrib/admin/static/admin/ /usr/share/graphite-web/static/admin
Enter fullscreen mode Exit fullscreen mode

Apache SPARK Metriklerini Graphite'ye Yönlendirme

Apache SPARK metriklerini Graphite'ye yönlendirmek için SPARK'ın konfigurasyon dosyalarından bazılarında düzenlemeler yapacağız.

Öncelikle SPARK metric.properties dosyasını düzenleyelim. Bu dosya SPARK'ın kurulu olduğu dizinde conf dizinin altında bulunmaktadır.Eğer bu metric.properties dosyası yoksa metric.properties.template'den kopyalayarak üretebilir veya elle oluşturabilirsiniz. metric.properties dosyasının içeriği aşağıdaki gibi olmalıdır.Diğer satırlar silinebilir veya yorum olarak kalabilir.

driver.sink.graphite.class=org.apache.spark.metrics.sink.GraphiteSink
executor.sink.graphite.class=org.apache.spark.metrics.sink.GraphiteSink
worker.sink.graphite.class=org.apache.spark.metrics.sink.GraphiteSink
master.sink.graphite.class=org.apache.spark.metrics.sink.GraphiteSink
# Example configuration for Graphite sink
*.sink.graphite.class=org.apache.spark.metrics.sink.GraphiteSink
*.sink.graphite.host=<HOSTNAME VEYA IP>
*.sink.graphite.port=2003
*.sink.graphite.period=10
*.sink.graphite.unit=seconds
*.sink.graphite.prefix=<KEY>
Enter fullscreen mode Exit fullscreen mode

Yine aynı dizinde bulunan spark-default.conf dosyasına aşağıdaki satırları ekliyoruz.Benim ortamımda SPARK, /opt/spark dizininde kurulu olduğu için bu şekilde düzenledim. İkinci satırı kendi ortamınıza göre düzenlemelisiniz.

spark.metrics.namespace spark
spark.metrics.conf /opt/spark/conf/metrics.properties
Enter fullscreen mode Exit fullscreen mode

SPARK'ı yeniden başlattıktan sonra Graphite arayüzünden SPARK'ın metriklerini görüntüleyebiliyor olmalıyız.

Hadoop Metriklerini Graphite'ye Yönlendirme

Hadoop metriklerini Graphite'ye yönlendirmek için Hadoop'un konfigurasyon dosyalarından bazılarında düzenlemeler yapacağız.

Öncelikle Hadoop hadoop.metric2.properties dosyasını düzenleyelim. Bu dosya Hadoop'un kurulu olduğu dizinde ./etc/hadoop dizinin altında bulunmaktadır.Eğer bu hadoop.metric2.properties dosyası yoksa hadoop.metric2.properties.template'den kopyalayarak üretebilir veya elle oluşturabilirsiniz. hadoop.metric2.properties dosyasının içeriği aşağıdaki gibi olmalıdır.Diğer satırlar silinebilir veya yorum olarak kalabilir.

# GraphiteReporter ayarları
*.sink.graphite.class=org.apache.hadoop.metrics2.sink.GraphiteSink
*.sink.graphite.host=<HOSTNAME VEYA IP>
*.sink.graphite.port=2003
*.sink.graphite.period=10
*.sink.graphite.prefix=HADOOP
Enter fullscreen mode Exit fullscreen mode

Yine aynı dizinde bulunan core-site.xml, hdfs-site.xml, yarn-site.xml, mapred-site.xml dosylarına aşağıdaki satırların eklenmesi durumunda ilgili metrikler Graphite'ye aktarılmış olacaktır..Benim ortamımda Hadoop, /opt/hadoop dizininde kurulu olduğu için bu şekilde düzenledim. değerini kendi ortamınıza göre düzenlemelisiniz.

<property>
  <name>hadoop.metrics2.file.filename</name>
  <value>/opt/hadoop/etc/hadoop/hadoop-metrics2.properties</value>
</property>
Enter fullscreen mode Exit fullscreen mode

GRAFANA ARAYUZUNDEN METRIKLERIN GORUNTULENMESI

Şimdi sırada Grafana arayüzünden bu metrikleri kullanabilmeye geldi. Bu kısımda çok çeşitli kombinasyonlar yapılabileceği için kısa bir örnek göstereceğim.

Öncelikle daha önce kurduğumuz Grafana arayüzüne bağlanarak giriş yapmalıyız.
Ardından sol tarafta açılabilir menü de bulunan Administration sekmesine tıklıyoruz.

Image description

Açılan pencere DataSource'a tıklayıp Arama çubuğuna Graphite yazarak buluyoruz.

Image description

Açılan formda URL kısmına başında "http://" olacak şekilde Graphite sunusunun ip adresini yazarak bağlantıyı kaydediyoruz.İsterseniz Name kısmını da değiştirebilirsiniz.

Image description

Son olarak Grafana'da Dashboard hazırlayarak metriklerimizi izleyebiliriz. Bunun için Grafana arayüzünde, sağ üstte bulunan "+" işaretine tıklıyoruz ve New Dashboard'u seçiyoruz.

Image description

Açılan pencerede "+Add Visualization" u seçerek devam ediyoruz.

Image description

Burada karşımıza DataSource seçim ekranı geliyor. DataSource olarak Graphite'yi seçerek devam ediyoruz.

Image description

Açılan sayfada Graphite anahtarımızı , hangi metriği izleyeceğimizi ve hangi formatta görüntüleyeceğimizi seçerek tamamlıyoruz. Birden fazla metrik aynı yöntem takip edilerek farklı şekillerde düzenlenebilir.

Bu şekilde Apache SPARK veya Hadoop metriklerini Grafana üzerinden görüntüleyebilmek için adımları tamamlamış olduk.

💖 💪 🙅 🚩
nurhaksenturk
Nurhak Şentürk

Posted on June 21, 2023

Join Our Newsletter. No Spam, Only the good stuff.

Sign up to receive the latest update from our blog.

Related