Skriv ut som pdf om du vill ha en pdf! Om du vill ha en snyggare utskrift, klicka bort webbläsarens automatiskt tillagda sidhuvud och sidfot.

Blekinge Tekniska Högskola
Institutionen för datavetenskap

Revision: 3
Dnr: BTH-4.1.14-1494-2022


Kursplan

Intelligent dataanalys

Intelligent Data Analysis

6 högskolepoäng (6 credits)

Kurskod: DV1597
Huvudområde: Datavetenskap, Teknik
Utbildningsområde: Tekniska området
Utbildningsnivå: Grundnivå
Fördjupning: G1F - Grundnivå, har mindre än 60 hp kurs/er på grundnivå som förkunskapskrav

Undervisningsspråk: Engelska
Gäller från: 2023-01-25
Fastställd: 2023-01-25

1. Beslut

Denna kurs är inrättad av dekan 2018-05-18. Kursplanen är fastställd av prefekten vid institutionen för datavetenskap 2023-01-25 och gäller från 2023-01-25.

2. Förkunskapskrav

För tillträde till kursen krävs avklarad kurs Matematisk statistik, 6 hp samt 12 hp avklarade från moment i programmeringskurser.

3. Syfte och innehåll

3.1 Syfte

Kursens syfte är att lära studenterna att undersöka datauppsättningar som består av olika datatyper, till exempel tabulär data, textdata, eller tidsserier. Studenterna ska lära sig att förbehandla dessa datauppsättningar för att undvika vanliga problem, till exempel felande värden, eller att omforma datauppsättningar för att uppfylla behovet av valt analysteknik. Dessutom ska studenterna lära sig att upptäcka, bekräfta och visualisera relationer och mönster i data genom att använda visualiseringar och statistisk analys.

3.2 Innehåll

Kursen innehåller tre huvudämnesområden, nämligen databehandling, datavisualisering och statistisk dataanalys. Inom dessa områden innehåller kursen följande aspekter.
Databehandling:
• Olika typer av data
• Datarengöring samt hantering av saknade/felande värden
• Dataomformning
Datavisualisering:
• Vanliga diagram för att undersöka data, t.ex. låddiagram, färgdiagram
• Interaktiva diagram
• Visualisering av högdimensionell data, t.ex. t-SNE
Statistisk dataanalys:
• Deskriptiv statistik och sannolikhetsfördelningar
• Regressionsanalys
• Parametriska och icke-parametriska statistiska tester, t.ex. fördelningstester, korrelation, hypotesprövning

4. Lärandemål

Följande lärandemål examineras i kursen:

4.1. Kunskap och förståelse

Efter genomförd kurs ska studenten kunna:

  • Demonstrera förmågan att förklara olika databehandlingsmetoder som passar olika datatyper
  • Demonstrera förmågan att förklara olika visualiseringar och deras tolkning
  • Demonstrera förmågan att förklara olika statistiska dataanalysmetoder och deras förutsättningar

4.2. Färdighet och förmåga

Efter genomförd kurs ska studenten kunna:

  • Demonstrera förmågan att bygga databehandlingspipelines för olika datatyper
  • Demonstrera förmågan att använda och anpassa datavisualiseringar för respektive dataanalysuppgift
  • Demonstrera förmågan att använda olika statistiska dataanalysmetoder för att samla bevis för eller emot vissa relationer inom en datauppsättning

4.3. Värderingsförmåga och förhållningssätt

Efter genomförd kurs ska studenten kunna:

  • Demonstrera förmågan att välja lämpliga metoder för datarengöring och förbehandling
  • Demonstrera förmågan att välja lämpliga visualiseringar för att upptäcka relationer och mönster inom datauppsättningar
  • Demonstrera förmåga att välja lämpliga statistiska analysmetoder baserande på givna data

5. Läraktiviteter

Kursens innehåll behandlas i föreläsningar. Dessutom ska studenterna skaffa sig ytterligare kunskap genom självstudier av relevant litteratur. Förutom föreläsningar förekommer inlämningsuppgifter veckovis för att hjälpa studenterna med praktisk övning av behandlade ämnen.
Dessutom ska studenterna demonstrera deras kunskap genom ett mindre projekt om tidsserieanalys och genom ett större projekt där studenterna ska analysera en datauppsättning för att upptäcka, bekräfta och visualisera relationer och mönster i datan.

6. Bedömning och examination

Examinationsmoment för kursen

Kod Benämning Omf. Betyg
2105 Inlämningsuppgifter 2 hp GU
2115 Projektuppgift 1 hp AF
2125 Rapport 3 hp AF

Kursen bedöms med betygen A Utmärkt, B Mycket bra, C Bra, D Tillfredställande, E Tillräckligt, FX Underkänd, något mer arbete krävs, F Underkänd.

I kurstillfällets information inför kursstart framgår i vilka examinationsmoment som kursens lärandemål examineras samt gällande bedömningsgrunder.

Examinator kan, efter samråd med högskolans FUNKA-samordnare, fatta beslut om anpassad examinationsform för att en student med varaktig funktionsvariation ska ges en likvärdig examination jämfört med en student utan funktionsvariation.

7. Kursvärdering

Kursvärdering ska göras i enlighet med BTH:s beslut om frågeställning i kursvärderingar och beslut om process för hantering och uppföljning av kursvärderingar.

8. Begränsningar i examen

Kursen kan ingå i examen men inte tillsammans med annan kurs vars innehåll, helt eller delvis, överensstämmer med innehållet i denna kurs.

9. Kurslitteratur och övriga lärresurser

Huvudlitteratur
• Field Cady The Data Science Handbook Wiley, 2017, ISBN 978–1119092940

Referenslitteratur
• Wes McKinney Python for Data Analysis O’Reilly Media, Inc., 2012, ISBN 978– 1449319793
• Jake VanderPlas Python Data Science Handbook: Essential Tools for working with Data O’Reilly UK Ltd., 2016, ISBN 978– 1491912058