02401 Dataanalyse og indledende statistik,
Forår 2003.
Eksamensopgavesæt 3. juni 2003
|
Løsning til
eksamensopgaver 3. juni 2003
(revideret udgave af 4. juni) |
Fordeling af opnåede points
ved eksamenssættet juni 2003 |
Meddelelser
Vigtige meddelelser vil - som supplement til forelæsningerne og
meddelelser på CampusNet - blive bragt her.
Eksamensopgavesæt efteråret
2002 |
Løsning til
eksamensopgaver efteråret
2002
|
Eksamensopgavesæt efteråret
2001 |
Løsning til
eksamensopgaver efteråret
2001
|
Foreløbig ordliste (alfabetisk efter den engelske
term) |
Trykfejl lærebogens
opgave 7.48 |
Det græske alfabet |
Om kapitel 2 |
Om frihedsgrader (ved summary of data,
kap 2) |
Om fordelinger relateret til normalfordelingsmodeller
|
Om kapitel 4 |
Om fordelinger af flere
stokastiske variable (matematisk) |
New Scientist om p-værdier |
Første mødetid: tirsdag den 4. februar kl. 13
i Bygning 308 , aud. 12.
Lærebog:
J. D. Petruccelli, B. Nandram and M. Chen:
"Applied Statistics for Engineers and Scientists",
Prentice-Hall (1999), ISBN: 0-13-565953-1
Det overordnede formål med kurset er:
- At give deltagerne en baggrund for vurdering
af data (forsøgsresultater, løbende registreringer
vedrørende produktion og miljø mv)
og
specielt en forståelse
af "variation".
- At give en indføring i nogle simple grafiske
og analytiske værktøjer til analyse af data -
og værktøjernes begrænsninger
- At sætte deltagerne i stand til at forholde sig
til dataanalyser, som de møder i hverdagen, fx i aviser,
tekniske rapporter og videnskabelige artikler.
Kurset er udsprunget af de tidligere kurser "Statistik 1"
og "Introduktion til statistik og sandsynlighedsregning".
- Kurset benytter en anden - og nyere - lærebog
- er baseret på
væsentligt
flere deltageraktiverende elementer.
-
Den tidligere gennemgang af
stoffet ved forelæsninger er
erstattet af en vejledning (i form af
oversigter og eksempler) til selvstudium af bogen.
- De tidligere øvelses/grupperegnings timer er
erstattet af praktisk gruppearbejde i
databaren og bestå af såvel små
opgaver som lidt større praktiske opgaver
og projekter.
- Der er oprettet et chat-room, hvor grupperne kan
diskutere indbyrdes og modtage vejledning fra øvelseslederne
Lærebogens opbygning
Lærebogen er udarbejdet med henblik på at give en
indføring i tidssvarende metoder for dataanalyse ved hjælp
af grafisk orienterede softwarepakker.
Lærebogen er udarbejdet med henblik på aktiv
læring og fælles læring i grupper
Hvert kapitel i lærebogen vedrører et bestemt
tema. Temaet behandles i kapitlet i
- beskrivende afsnit , som læses ved selvstudium
evt ved en edb-terminal eller PC for at afprøve eksemplerne
- diskussions spørgsmål (discussion
questions) beregnet til en kontrol af læserens forståelse
af de beskrivende dele.
- Øvelser (exercises) med begrebsmæssige
opgaver til uddybning af de begreber, der er indført, og
opgaver med data til indøvelse af dataanalytiske
færdigheder
- Miniprojekter
Opgaver, der illustrerer brug af statistiske
metoder som led i større problemstillinger.
- Laboratorieøvelser (Labs), der formulerer mere
strukturerede opgaver med indsamling og/eller analyse af data.
Undervisningens form
Hver uge har et tema som typisk vil bestå i et kapitel fra
bogen.
Sædvanligt ugeskema (Modul F4 A+B)
Kurset er opbygget efter nedenstående faste ugeskema:
Tirsdag kl. 13 - 15 i bygning 308, auditorium 12 ,
derefter databar 47 og 48 i bygning 302
Fredag kl. 8 - 10 i bygning 308, auditorium 12, derefter
databar 47 og 48 i bygning 302
|
Tirsdag |
|
|
Fredag |
13 -14 |
Opsamling fra LABS og miniprojekter |
|
8 - 10 |
Eksempler, resume - eller matematisk orienteret supplering |
14 -15 |
Introduktion til ugens stof | |
|
|
15 - 17 |
Exercises ,
| |
10 - 12 |
LABS og miniprojekter, |
Ideen er,
- at ugens tema introduceres ved en forelæsning om tirsdagen
fra 14 -15 .
Det
forudsættes, at deltagerne har læst kapitlet hjemmefra ,
og introduktionen vil
give et overblik over temaet med vægt på de vigtigste
principper og metoder.
-
Efter introduktionen går deltagerne i databaren, hvor de i hold
laver nogle
af de i bogen foreslåede "exercises" for at opnå en
forståelse af begreber
og principper.
Næste modul er fredag formiddag, og
inden da vil det være en god ide at genlæse de vigtigste
steder hørende til
temaet.
- Fredag starter med en forelæsning fra 8 -10, hvor der vises
eksempler, og tirsdagens oversigt uddybes - eller der gives en mere
matematisk orienteret uddybning af kapitlets indhold.
Hvilken af de to former, der tilbydes, vil blive annonceret.
-
Dagen
afsluttes med "labs" - praktiske opgaver fra bogen (F.eks.: mål
hinandens reaktionstid, lav en statistisk analyse af resultaterne og
skriv en
kort rapport),
der laves i databaren.
Temaet afsluttes endeligt den følgende
uge,
hvor
rapporterne fra fredagens "labs" evalueres (f.eks. ved at man diskuterer en
anden gruppes rapport eller fremlægger sin rapport i plenum).
Desuden vil der i løbet af semesteret blive arrangeret
foredrag med tidligere
studerende og andre, der fortæller om deres arbejde med
dataanalyse og statistik
i "den virkelige
verden".
Grupper
Ved undervisningens start vil der blive etableret faste grupper.
Deltagerne i gruppen arbejder sammen omkring øvelser,
diskussionsspørgsmål, laboratorieøvelser og
projektopgaver
og forelægger evt. resultatet for andre grupper.
Grupperne er yderligere organiseret i hold, som
er tilknyttet en hjæpelærer.
Projektopgaver
3 gange i løbet af semesteret (i ugerne 9, 14 og 18)
erstattes temagennemgangen af
projektuger, hvor
deltagerne løser
en større praktisk opgave, der består i at lave en statistisk
analyse af nogle data og udarbejde en rapport over analysen
og dens resultater.
Eksamensform
2-timers skriftlig eksamen, hvor opgaverne vil være
af "multiple-choice" typen.
Ved eksamen er alle hjælpemidler tilladt, herunder også
alle tekniske hjælpemidler (lommeregner, batteridrevne
PC'er mv.) jvf regelsamling for DTU.
Desuden aflevering af tre obligatoriske projektopgaver udarbejdet
i de tre projektopgaveperioder. Bedømmelsen af disse 3 opgaver
tæller halvdelen af den endelige karakter.
SAS-systemet til dataanalyse- og datamanagement
Indføringen i et tidssvarende programsystem til
interaktiv grafisk og numerisk dataanalyse er en integreret del
af kurset. I kurset (og i lærebogen) benyttes
programsystemet SAS, som er implementeret på databarsystemet
på DTU:
SAS til PC
Studerende ved DTU
har mulighed for at låne en CD-rom
med SAS version 8 til installation på PC.
CD-rom'en kan lånes ved henvendelse til Ellen Borup,
Bygning 321, rum 010. (Mandag - fredag kl. 13-15)
Max lånetid et døgn.
Vejledning i brug af SAS-systemet
Vejledning i
Brug af SAS-systemet i databar og på PC giver en
lille vejledning i start af systemet og brug af datasæt
Kursusnoten:
En introduktion til interaktiv dataanalyse
med programsystemet SAS, (Poul Thyregod, september 2001),
giver en oversigt over SAS-systemet og en mere udførlig
vejledning i
brug af en række af de tilbudte faciliteter.
Noten kan læses som en .pdf fil :
En introduktion til interaktiv dataanalyse
med programsystemet SAS
Kursus direktorium i g-baren:
/gbar/erlang/home2/g02401/g02401
Links:
NIST Handbook of statistical Methods Elektronisk
håndbog i brug af statistiske metoder i natur- og
ingeniørvidenskabelige sammenhænge
NIST "Dataplot" software
Petruccelli Petruccelli hjemmeside
SAS Insight intro 1
SAS Insight intro 2
digital stopwatch
Petruccelli Petruccelli hjemmeside
NetStat dansk netbaseret kursus i statistik
machine-learning database School of
information and computer science, University of California, Irvine
Kolacz's statistical links
STEP's Statistical Education throug problem solving
Sample size and power Java applets for
sample size
Tabelopslag og
grafer for en række sandsynlighedsfordelinger.
Statistics
on the Web . Links til webkurser mv
Java Applets
. Links til diverse java applets
Webstat 2.0
. Java Applets for statistical analysis
Computer aided
instruction in Statistics,
Polytechnic University of Hongkong
Tilhørende
quizzer
Statmath, Indiana University Oversigt og vejledning
for statistisk software
Categorical data Tutorial og programmer
for kategoriske data
http://www.indiana.edu/~statmath/stat/all/cat/
SISA Simple Interactive statistical procedures
Electronic
Statistics textbook.
Udarbejdet af producenterne af programpakken
Statistica . Indeholder et omfattende spektrum af statistiske
værktøjer.
VassarStats Online lærebog med mulighed for
online udførelse af en række standard metoder,
tabelopslag mv.
Rice Virtual Lab in Statistics
Indeholder en online lærebog,
simulationseksempler, case studies og værktøjer til
sædvanlige simple statistiske analyser.
Statistical Science Web
StatCrunch Former Webstat. Software for data analysis on the
web
www.statistics.com
portal for brug af statistik, med kurser, newsgroups etc.
specielt links til hjemmesider med online beregninger
Hyperstat Online. Online lærebog, hvor de enkelte afsnit
indeholder links til sites med uddybende materiale.
Visual statistics with multimedia. Online lærebog med
vægt på på grafisk repræsentation af
data. Bogen er opdelt i kapitler svarende til sædvanlige
statistiske begreber. De enkelte kapitler giver forklaring af
begreber - samt angivelse af faldgruber.
Handouts indeholder opgaver og yderligere eksempler.
Prøv for eksempel
Quincunx
for en on-line demonstration af den centrale
grænseværdisætning, Petrucelli side 196.
another quincunx with a large number of bins.
yet another quincunx with variable number of bins
Westgard har under lessons
forskellige kvalitetsstyringsværktøjer for laboratorier.
Prøv for eksempel lesson 75, normalfordeling
Brisbane First year Statistics Bookmarks har også lidt
matematisk statistik, estimationsteori mv, som måske kan
være
relevant
Nigerian Fraud e-mail gallery
The history of Nigerian Fraud goes back to 1920, the Spanish Prisoner
Lærere
Poul Thyregod |
e-mail: pt@imm.dtu.dk
|
Jørgen Iwersen, Novonordisk A/S |
e-mail: jiw@novonordisk.com
|
http://www.imm.dtu.dk/courses/02401/index.html
Sidst ændret 2003-06-03