آمازون با دو اعلامیه در re:Invent گامی به سوی آینده ای با ETL صفر برمی دارد
به گزارش اپ خونه، آمازون امروز در AWS re:Invent در لاس وگاس چند اطلاعیه داد که به حرکت مدیریت داده به سمت آینده بدون نیاز به بار تبدیل استخراج یا ETL کمک می کند.
ETL آفت هر دانشمند و تیم داده است زیرا آنها سعی می کنند داده ها را شکل دهند تا آنها را عملی کنند. همانطور که آدام سلیپسکی، مدیر عامل AWS توضیح داد، ممکن است دادههایی در مکانهای مختلف مانند دادههای استفاده از برنامهتان در پایگاه داده و بررسیهای مشتریان در دریاچه دادهتان داشته باشید. کنار هم قرار دادن آنها تا کنون یک چالش مهم بوده است.
AWS یکپارچهسازی Aurora zero-ETL با Amazon Redshift را معرفی کرد تا به مشتریانی که از پایگاه داده Aurora و انبار داده Redshift استفاده میکنند، توانایی انتقال دادهها را بدون نیاز به انجام ETL روی آن بدهد.
سلیپسکی به مخاطبان re:Invent گفت: «ما چند سالی است که کار میکنیم و بین سرویسهای خود یکپارچهسازی میکنیم تا انجام تجزیه و تحلیل و یادگیری ماشین را بدون نیاز به پرداختن به ETL آسانتر کنیم.»
«اما اگر میتوانستیم کارهای بیشتری انجام دهیم چه؟ اگر بتوانیم ETL را به طور کامل حذف کنیم چه؟ این دنیایی خواهد بود که همه ما دوستش داریم. این چشم انداز ما است، چیزی که ما آن را آینده ETL صفر می نامیم. و در این آینده، ادغام دادهها دیگر یک تلاش دستی نیست. بنابراین امروز مشتاقم که پیش نمایش یک ادغام کاملاً مدیریت شده بدون ETL بین Aurora و Redshift را اعلام کنم.»
یک ادغام مشابه بین Amazon Redshift و Apache Spark، پلتفرم محبوب پردازش داده های بزرگ منبع باز را اعلام کرد. این قابلیت قابل مقایسه برای جابجایی داده ها بین دو پلتفرم بدون نیاز به استخراج، تبدیل و بارگذاری اولیه را ارائه می دهد.
ادغام Redshift-Aurora در پیش نمایش است. ادغام Redshift-Apache Spark اکنون در همه مناطق در دسترس است.