
Buluttaki veriler
Çeşitli motivasyonlar için, birçok kuruluş verileri buluta yerleştirmeye ve işlemeye karar verdi.
Bulutu kullanmaya yönelik bir yaklaşım, buluta çok fazla veri atmaktır. Bulut satıcıları bu yaklaşımı savunuyor.
Ancak – çeşitli nedenlerden dolayı – bulutun ekonomik ve verimli kullanımını büyük ölçüde artıran, buluta yalnızca veri atma konusunda mimari bir incelik vardır.
Bulutta verileri yönetmenin ve işlemenin çok daha iyi bir yolu var:
- Çok daha ucuz
- Çok daha verimli
- Daha işlevsel olarak etkinleştirildi
- Herhangi bir işlevsellik kaybı olmadan
Bu yaklaşım “Mimari Bulut Yönetim Yaklaşımı” olarak adlandırılabilir ve bu belgede açıklanmıştır.
Öyleyse, bulut verilerinin yönetimine yönelik mimari bir yaklaşım sizin için ne yapabilir?
Mimari Bulut Yönetimi Yaklaşımı şunları yapabilir:
- Bulutta hiçbir şekilde kullanmayacağınız verileri azaltarak çok paradan tasarruf edin. Büyük miktarda verinin buluttan tamamen kaldırılması size anında geri ödeme yapar.
- Sorguları hızlandırın. Artık kaçak sorgular yapmanıza gerek yok. Tam olarak hangi verilerin işleneceği konusunda çok daha fazla kontrole sahip olacaksınız. Bu da paradan tasarruf etmenizi sağlar.
- İşlevselliği artırın. Artık metinsel verileri bulutta işlemeye hemen başlayabilir, bağlamı anlayabilir ve analitik işleme için standart veritabanlarını kullanabilirsiniz.
- Buluta geçmenin herhangi bir işlevsel özelliğini kaybetmeyin. Aslında, bulutta analitik işleme yeteneklerini geliştirirsiniz.
- Bunların hepsini basit bir şekilde yapın.
Gerçek Olamayacak Kadar İyi?
Bu kulağa gerçek olamayacak kadar iyi mi geliyor?
Size nasıl olduğunu gösterelim… çünkü bu doğru.
(Ve bu arada, tüm bunları yapmak hayal bile edemeyeceğiniz kadar kolay.)
Temel Veri Türleri
Bulut yönetimi için bir mimariye yönelik hikayemiz, buluta koyduğunuz temel veri türlerinin anlaşılmasıyla başlar.
Bulutta üç temel veri türü vardır:
- Yapılandırılmış, işleme dayalı veriler (“standart” veri türü)
- Metinsel veriler (konuşmalar, kısa notlar, İnternet alıntıları, çağrı merkezi konuşmaları vb.)
- Analog/IoT verileri (makineler tarafından üretilir)
Çok Sayıda Metin Verisi
Farklı veri türleri arasında, genellikle yapılandırılmış verilerden çok daha fazla metinsel veri vardır. Şimdi yoksa yarın olacak. Bulut satıcısı, buluta koyabildiğiniz kadar çok veri koymanızı teşvik eder.
Satıcı, buluttaki veriler ve bu verilere karşı gerçekleştirilen analitik işlemler için sizden ücret alarak para kazanır. Sağlayıcı, buluta koymanız için ne kadar fazla veri sağlayabilirse, doğrudan veya dolaylı olarak o kadar fazla ödeme yaparsınız. Buluttaki veriler için doğrudan ödeme yaparsınız. Ancak bu verilere karşı çalışan sorgular için dolaylı olarak daha da fazla ödeme yaparsınız. Ne kadar çok veriye sahip olursanız, sorgu o kadar büyük olur. Sorgu ne kadar büyük olursa, o kadar fazla ödersiniz.
Peki ya buluta çok daha az veri koyabilseniz ve yine de yapmak istediğiniz tüm işlemleri yapsanız?
TEKRARLAYIN: Satıcı, buluttaki veriler ve bu verilere karşı gerçekleştirilen analitik işlemler için sizden ücret alarak para kazanır. Satıcı, buluta koymanız için ne kadar çok veri sağlarsa, doğrudan veya dolaylı olarak o kadar çok ödersiniz…
Diğer sorunlar
Ancak buluttaki veri hacmi, tek inatçı ve pahalı sorun değil. Bir sonraki önemli konu, metinsel verileri bulutta analitik olarak fiilen işleyebilmeniz ve kullanabilmenizdir.
Buluttaki veya başka herhangi bir yerdeki metinsel verilerin analitik olarak işlenmesinin bu kadar zor olmasının birçok nedeni vardır.
Metinsel veriler, analitik olarak hiçbir zaman bir değeri olmayacak çok sayıda laf kalabalığı içerir.
Basit bir cümle düşünün: “Kızımla mağazadayken konuştum.”
“Kızım” ve “mağaza” sözcüklerinin bazı analitik değerleri olabilir (her ne kadar bundan şüphe duysam da), ancak “ben”, “o”, “ile”, “içinde” vb. herhangi bir analitik değere sahip olacaktır. Yine de, satıcı sizden bu kelimeler için diğerleri kadar ödeme yapmanızı istiyor. Sorun şu ki, yararlı metinsel verilerden çok daha fazla yararsız metinsel veri var. Yine de satıcı, hiçbir zaman yararlı olmayacak tüm veriler için ödeme yapmanızı ister. Asla.
Başka bir deyişle, satıcı asla kullanmayacağınız bir şey için sonsuza dek ödeme yapmanızı istiyor. Bu ne kadar mantıklı?
Bulutta veya başka herhangi bir yerde metnin analitik olarak işlenmesiyle ilgili bir başka önemli sorun da, analitik yapmak için hem metnin hem de bağlamın yakalanması gerekliliğidir. Metnin bağlamını anlamadan, bulutta veya başka bir yerde metni başarılı bir şekilde işleyemezsiniz. Bağlamla ilgili sorun, metinde yapılandırılmış dünyada olduğundan çok farklı bir biçim almasıdır. Metinden bağlam türetmek, metnin kendisini fiilen işlemekten daha zordur.
Metinle ilgili bir diğer önemli sorun, dilde bulunan sözcüklerin tekrarlanması ve karıştırılmasıdır. Örneğin, “ateş” kelimesi ne anlama geliyor? Bu benim evim yandığında mı oluyor? Patronum bana artık onların şirketinde çalışmadığımı söylediğinde olan bu mu? Silahın tetiğini çektiğimde olan şey mi?
Aslında “ateş” kelimesi bunların hepsi ve daha fazlasıdır. Ancak metni anlamak ve onu analitik olarak kullanmak için, kelimeyi çok kesin bir şekilde anlamam gerekiyor. Ve dil bu tür anormalliklerle DOLU. TAM DOLU!
Ve ham metni okumanın ve ham metni analiz için kullanmanın önündeki engellerin listesi uzayıp gidiyor. Ham metni bulutta sakladığınızda, gerçekten onunla pek bir şey yapamazsınız. Ham metni kesinlikle bulutta verimli veya etkili bir şekilde analiz edemezsiniz. Ancak satıcı bunun için ödeme yapmanızı sağlar ve bu da işlemlerinizi tıkayarak sorguları verimsiz ve pahalı hale getirir.
Yani, sadece veri depolama ve işleme için ödediğiniz miktar değildir. Buluta yerleştirdikten sonra analistinizin orada olanı fiilen kullanma yeteneğidir.
Mimari Bulut Yönetim Çözümü
Peki… tüm bu sorunların bir çözümü var mı? Evet çok şükür var.
Çözüm, Bulut Yönetimine Mimari Yaklaşım olarak adlandırılır.
Metinsel veriler buluta yerleştirilmeden önce, metinsel ETL adı verilen veri deposu yönetimi teknolojisinden geçirilebilir. Metinsel ETL ile ham metin bağlamsallaştırılmış bir veri tabanına indirgenebilir. Bu veri tabanı azaltma:
- Buluta koymak istediğiniz veri miktarını büyük ölçüde azaltır (ve paradan tasarruf etmenizi sağlar)
- Yaptığınız sorguları büyük ölçüde hızlandırır (ve size para ve zaman kazandırır)
- Analitik yeteneklerinizi büyük ölçüde geliştirir çünkü artık anında analiz için uygun bağlamsallaştırılmış bir veritabanına sahipsiniz. Artık metin analizi yapmanın önündeki tüm engeller kaldırılmıştır.
Başka bir deyişle, bulutun tüm avantajlarına sahip ve hiçbir dezavantajı olmayan uygulanabilir bir çözüme sahipsiniz.
Bilinmeyen Gelecek Analizi Ne Olacak?
Bu noktada sorulan acil sorulardan biri şudur: Tüm metnimi buluta koymayarak, gelecekteki bilinmeyen analizleri yapma yeteneğimi kaybetmez miyim? Ya buluta koymadığım bir şeyi analiz etmek istersem?
Sorun yok. Siz sadece neyi analiz etmek istediğinize karar verin, toplu depolamaya geri dönün, aradığınızı bulun ve ardından onu bağlamsal bir veri tabanına koyun ve buluta yerleştirin. Böylece, ilginç olduğunu düşündüğünüz herhangi bir veriyi yine de analiz edebilirsiniz.
Ancak şimdi, bu analizi bulutta yapmak ucuz ve verimli.
Bir Arşiv Tesisi
Ayrıca toplu depolamayı yalnızca metinsel veriler için değil, her türlü veri için bir arşivleme tesisi olarak kullanabilirsiniz. Kullanılmayan ve kullanılmaması muhtemel verileri bulut dışına taşıyarak, bulutta sahip olduğunuz veri miktarını azaltabilir ve bulutta işlemlerinizi hızlandırabilirsiniz.
Seçim senin
Öyleyse seçim sizin — bulutta çok fazla zaman ve kaynak tüketen pahalı, savurgan gereksiz işlemler yapmak ister misiniz? Asla kullanmayacağınız kaynaklar için sonsuza kadar ödeme yapmaktan zevk alıyor musunuz?
Yoksa zamandan ve paradan tasarruf eden ve analitik sürecinizi kolaylaştıran mimari bir yaklaşım mı benimsemek istiyorsunuz?
Seçim senin.