Neljä todellista päätöstä muovaavat rakennushanketta. Jokaiselle on puolustettava vastaus kumpaankin suuntaan.
Pilvinatiivi vai itse isännöity. Pilvinatiivi (Snowflake, BigQuery, Databricks) on nopeampi pystyttää ja poistaa suurimman osan ylläpitotyöstä. Itse isännöity (Postgres VM:llä, ClickHouse, DuckDB) on halvempi pienessä mittakaavassa ja välttää siirtomaksut. Pohjoismaiset keskisuuret yritykset hallitulla kustannuskäyrällä päätyvät usein Postgresiin tai DuckDB:hen ensimmäiseksi 12 kuukaudeksi ja siirtyvät pilvivarastoon, kun datamäärä ylittää rajan, jossa ylläpitokustannus ylittää lisenssikustannuksen.
Varasto vai lakehouse. Varasto pitää sisällään jäsenneltyjä tauluja. Lakehouse lisää edullisen oliotallennuksen raakatiedostoille taulujen rinnalle. Yritykset, jotka käsittelevät vain jäsenneltyä dataa (myynti, talous, tuoteanalytiikka), valitsevat yleensä varaston. Yritykset, jotka käsittelevät dokumentteja, lokeja, kuvia tai ääntä (juridiikka, terveydenhuolto, valmistus), valitsevat yleensä lakehousen. Databricks hallitsee lakehouse-kategoriaa. Snowflake on lisännyt lakehouse-ominaisuuksia kuroakseen kiinni.
Reaaliaikainen vai erä. Useimmat raportointitarpeet eivät vaadi alle minuutin tuoreutta. Eräpäivitykset tunnin tai yön välein hoitavat 90 prosenttia tapauksista kymmenykseen kustannuksesta. Reaaliaikaisuudella on väliä petoksen havaitsemisessa, operatiivisessa valvonnassa ja asiakaskäyttöön suunnatussa analytiikassa. Rakenna eräkäsittely ensin. Lisää reaaliaikaiset putket myöhemmin niille käyttötapauksille, jotka sen perustelevat.
Räätälöidyt datasovellukset vai BI-työkalut. Jourierin kanta on suora: rakenna analytiikkakerros oikeina tuotelaatuisina sovelluksina, jotka asiakas omistaa. Kunnollinen frontend-kehys (React, Next.js, Vue). Kunnollinen backend-kehys (FastAPI, Express, Django). Visualisointikirjastot sovelluksen sisällä (D3, Recharts, ECharts). Asiakkaan ympäristössä. Jokainen BI-työkalukategoria on tässä näkymässä vanhentunutta. Kaupalliset BI-työkalut (Power BI, Tableau, Looker, Qlik) veloittavat käyttäjäkohtaisia maksuja ja lukitsevat yrityksen. Avoimen lähdekoodin BI (Metabase, Superset, Lightdash) rajaa työn siihen, mitä projektin kehittäjät rakensivat. Nopean prototypoinnin kehykset (Streamlit, Plotly Dash, Gradio) näyttävät ja tuntuvat Streamlit-sovelluksilta eivätkä skaalaudu tuotelaatuiseen käyttökokemukseen. Low-code-sisäisten työkalujen rakentajat (Retool, Internal.io) vaihtavat toimittajalukon rakennusnopeuteen. Poikkeus kaikissa näissä kategorioissa on hankintapakotetut ympäristöt, joissa tietty työkalu on sopimuksella vaadittu. Siellä järjestelmä palvelee sitä, samalla kun siirtymäsuunnitelma räätälöityihin sovelluksiin etenee rinnalla.
Avoin lähdekoodi vai kaupallinen infrastruktuuri. Nykyinen avoimen lähdekoodin työkalusukupolvi (Postgres, dbt, DuckDB, Iceberg, Trino) kattaa sen, mitä useimmat pohjoismaiset keskisuuret yritykset tarvitsevat. Kaupallinen infrastruktuuri (Snowflake, Databricks, BigQuery) ansaitsee lisenssimaksun siellä, missä se aidosti pärjää paremmin mittakaavan kyselysuorituskyvyssä, monialueisissa kokoonpanoissa tai tietyissä vaatimustenmukaisuussertifikaateissa. Valitse kaupallinen, kun ero on aito. Valitse avoin lähdekoodi, kun ero ei ole.