データサイエンスコースで学んだデータベースの知識をまとめます.
大規模データの分析を強力にサポート: Apache Sparkの概要
Apache Sparkは、大規模なデータを扱うためのオープンソースの統合分析エンジンです。 Apache Spark 3.0からはGPUを扱った並列分散処理、3.2ではSpark上でPandas APIの利用が可能とな...
データサイエンスコースで学んだデータベースの知識をまとめます.
Apache Sparkは、大規模なデータを扱うためのオープンソースの統合分析エンジンです。 Apache Spark 3.0からはGPUを扱った並列分散処理、3.2ではSpark上でPandas APIの利用が可能とな...
「データを利用した〇〇のサービスを始めるなら、□□のAPIを利用して〜」 データを利用したビジネスやアプリケーション開発に関わる人は、こんな会話を耳にするのではないでしょうか。 APIとよく耳にしますが、APIが何なのか...
データ・オブジェクトはデータベースのエンティティを意味し、アトリビュートを使って記述します。 データ・オブジェクトの記述に使うアトリビュートとはなんでしょう?この記事は「アトリビュートの定義・種類・例」についてまとめます...
世はまさにビッグデータビジネスの時代。 データサイエンスへの注目も年々高まっていますが、一方で、「eコーマス、SNSを起点とした新しいデータの出現」「急激に増加し続けるデータ」などを背景に、私たちが気づかないところでは、...
ETL、ELTはデータの処理プロセスに関する用語です。 行政、産業、科学、医療、 etc.、あらゆる分野において、ビッグデータの活用が注目されています。 しかし、データソースから得られたデータを分析用データと統合する前に...
ニュースや職場でたびたび耳にするビッグデータ。 ではビッグデータとはどんなデータでしょうか。データの数が多ければ、それをビッグデータと呼べるのでしょうか。 この記事では「ビッグデータの定義」と「ビッグデータが注目されてい...