Bacheloroppgave 2017
Studium: Bachelor i ingeniørfag, data

 

Tittel - norsk: Analyse av stordata fra vannkraftverk
Tittel - engelsk: Analyzing big data from a hydropower plant

Oppgave nr.: 36

Oppgavestiller: Voith Hydro As

 

Kontaktperson: Øyvind Holm

 

Telefon: + 47 922 61 615

E-postadresse: Oyvind.Holm@Voith.com

 

Postadresse: Sluppenvegen 25, 7037 Trondheim, Norge

Studenter: Marius Lauvland, Børge Størvold og Anders Thon

Veileder ved NTNU: Nils Tesdal 

 

Sammendrag:

Oppgaven har gått ut på å analysere, presentere og predikere signal fra et vannkraftverk. Den fokuserer på signaler som etter blant annet principal component analysis, korrelasjonsanalyse og heat mapping bevist har en effekt på, eller korrelasjon med, en bestemt komponent i kraftverket. Disse signalene ble igjen kombinert med andre signaler, valgt ut på bakgrunn av oppdragsgivers domenekunnskap, for å kunne bygge stordatasett til maskinlæringsalgoritmer.

Det ble utviklet to modeller. En basert på den generiske tilnærmingen ved å benytte partial least square regression, den andre en fysisk modell som et mer tilgjengelig alternativ. De avledede dataene fra den fysiske modellen ble igjen brukt til å forbedre algoritmens predikasjoner og nøyaktighet.
Oppgaven er løst ved hjelp av Python med tilhørende biblioteker som Matplotlib og Scikit-learn, samt programmene RapidMiner og Microsoft Excel til å prosessere og analysere signalene. 


Abstract in English:

This thesis presents methods and techniques to analyze, present and predict signals from a waterpower plant. It focuses on signals that after principal component analysis, correlation analysis and heat mapping have a well-documented effect on, or correlation with, a specific component in the power plant. These signals were then combined with other signals, chosen on the basis of the client’s domain knowledge, to build sets of big data for machine learning algorithms.

Two models were developed. One based on the generic approach using a partial least squares regression, the second is a physical model as a comprehensible alternative. The data derived from the physical model were used to enhance the algorithm’s prediction and preciseness.
The thesis is solved using Python with libraries such as Matplotlib and Scikit-learn, and RapidMiner and Microsoft Excel to process and analyze the signals.

 

 

Hovedregelen er at studentoppgaver skal være offentlige. I særlige tilfeller kan partene bli enig om at hele eller deler av oppgaven skal være undergitt utsatt offentliggjøring i maksimalt 3 år,  dvs. ikke tilgjengelig for andre enn student og bedrift i denne perioden.

Oppgaven skal være undergitt utsatt offentliggjøring i 

 

ett år  

X

to år  

 

tre år

 

   

(sett kryss bak antall år hvis dette punktet er aktuelt)

 

Behovet for utsatt offentliggjøring er begrunnet ut fra følgende:

 

Oppgaven er en del av et utviklingsarbeid oppgavestiller ønsker å beskytte av konkurransemessige hensyn.