Refleksion over hvilken database

Vi vælger at arbejde med Document Database. Grunden til at vi har valgt document database skyldes at den komplementære det vi gerne vil opnå med vores database rigtigt godt. Den gør det nemt at hente alle dokumenter i kollektionen og lave analyse over dem, hvilket er utroligt vigtigt i Machine Learning, da det er nødvendigt til at udvikle ens model, og vælge hvilken algoritme man skal arbejde med. Den har mere eller mindre alle de samme perks som de andre NoSQL databaser har, i og med at den er skalerbar og fleksibel. Den er nem at arbejde med gennem andre programmer da dokumenterne bliver gemt i JSON format.

Hvorfor vælger vi ikke:

  • Graph SQL -> Grunden til vi ikkke vælger graph sql er fordi at vores datasæts datapunkter ikke har nogle direkte relationer til hinanden. Vi har ikke brug for at struktuere med relations da det ikke er nødvendigt, fordi vi har med rå data at gøre. 
  • Column oriented database -> god til at indexe data i store datasæt, men ikke god til at bygge videre på datasættet eller god til brug hele datasættet på en gang. God til at arbejde i hele kolonner. 
  • Key value -> gode til at finde specifikke værdier i et datapunkt ved anvendelsen af key strukturen. Hvilket gøre det hurtigt at indexere igennem hvis man vil finde en specifik værdi i et datapunkt. Den er dog dårlig til at finde hele kollektioner. De eneste queries som er effektiv er one-row-at-a-time queries. Og ikke god når data modeller vokser i kompleksitet.

Leave a comment

Design a site like this with WordPress.com
Get started