Enflasyon hesabına internetten satış fiyat aralıkları da eklenecek

Enflasyon hesabına internetten satış fiyat aralıkları da eklenecek

Enflasyon hesabına internetten satış fiyat aralıkları da eklenecek

Türkiye İstatisik Kurumu (TÜİK), internet üstünden satışı gün geçtikçe yükselen bazı ürünlerin ücretinı da enflasyon hesaplamasında dikkate alacak.

TÜİK’ten alınan bilgiye göre, internet üstünden mal ve hizmet satın alımları gün geçtikçe daha da yaygınlaşırken istatistik ofislerinin söz konusu zengin veri kaynağını göz ardı etmemesi önem taşıyor. İnternet fiyat aralıklarının TÜFE’ye entegre edilmesinin gerekli duruma geldiği değerlendirilirken, böylece istatistik üretiminde veri derleme sıklığının daha yüksek ve daha büyük hacimli olması hedefleniyor. Söz konusu verilerin mevcut yapıyı geliştirmek ve yeni değişkenleri elde etmek için büyük bir fırsat sunduğu düşünülüyor.

Otomatik olarak bir web kaynağından veri derlemeye veri kazıma (web scraping) deniliyor. Bu genel olarak bir kazıyıcı (scraper) yardımıyla oluyor ve daha gelişmiş istatistiksel analizler için ham veriyi derleyip temizliyor.

Otomatik veri kazıma teknolojilerini tercih ederek günlük, saatlik ve bazı zaman daha yüksek sıklıkta veri yapısıyla optimal veri derleme stratejileri elde edilebiliyor. Böylece, geniş bir şekilde metaveri bilgileri derlenerek hesaplamalar geliştirilebiliyor. Bu yöntemde genel amaç, web sitesinde bulunan HTML formatındaki bilgiyi analiz ve hesaplamalar için daha uygun yapılara dönüştürmek.

Sitenin temsiliyet, içerik ve hacmine bakılacak

Bu yöntemde, uygun web sitesi seçimi için bazı kriterler de aranıyor. Bunun için sitenin temsiliyet, hacim, içerik kaynağı, sürdürülebilirliği, teknik donanımlari, metaveri ve hedef değişkenleri gibi unsurlara bakılıyor.

TÜİK, internetten veri kazıma çalışmaları içerisinde 2020 senesinde TÜBİTAK ile ortaklaşa TÜİK Büyük Veri İleri Analitik Projesi’ni gerçekleştirdi. Veri kaynakları olan firmalardan gerekli izinler alınarak, internetten veri kazıma fiyat derleme yönteminin altyapısı hazırlandı.

Proje sonucu gelen ham veri, TÜİK teknik personeli tarafından analiz edildi, yanlışlar belirlendi ve fiyat derlenebilecek hale getirildi. Daha sonra verinin tablo formatında, fiyat takibi yapılabilir ve veri analizine uygun olması sağlandı.

Ücreti yıl süresince izlenecek

Beyaz eşya, elektronik ürünler, mobilya, birinci el otomobiller ve otobüs bileti fiyat aralıkları için 2022 yılı saygınlığıyla internet üstünden derlenen fiyatlar endeks hesaplamalarında kullanılacak. Aralık ayı temel alınarak takibi kararlaştırılan ürünlerin ücreti, ürün kodu ya da ürün barkodu üstünden yıl süresince takip edilecek. Böylece aynı kalitedeki ürünlerin fiyat gelişimleri endeks hesaplamalarına yansıtılacak. Bu bağlamdaki fiyat aralıkların sayısı aylık ortalama 20 bin civarında.

Veri kazıma yoluyla elde edilen bilgiler günlük olarak takip edilerek fiyat değişim analizleri de yapılıyor. Bunun Yanı Sıra ücreti gelen ürünlerin satışının sık sıklığı da fiyat derleme dönemi içindeki fiyat rakamları kontrol edilerek gözleniyor.

İnternet verisinin kullanımı yaygınlaştırılacak

Gelecek zamanda yeni sisteme adapte edilen ürün fiyat aralıklarının günlük olarak veri akışı sağlanacak, analizleri yapılacak ve diğer veri derleme metotları olan barkod ve alan verisiyle beraber fiyat derleme döneminin sonunda endeks hesaplamalarında kullanılacak. TÜFE içerisinde derlenen aylık fiyat aralıkların ortalama olarak yüzde 40-45’i barkod ve internetten veri kazımayla elde edilmiş olacak ve böylece veri, kaynağında mümkün olan en doğru haliyle derlenecek.

TÜİK, bu bağlamda en az maliyetle en doğru veriyi elde edebilecek. Bu hedef ışığında diğer ülke çalışmaları da dikkate alınarak barkod ve internet verilerinin kullanımının yaygınlaştırılması öngörülüyor.

1 Beğenmekten Vazgeç