Geschreven door studenten die geslaagd zijn Direct beschikbaar na je betaling Online lezen of als PDF Verkeerd document? Gratis ruilen 4,6 TrustPilot
logo-home
Tentamen (uitwerkingen)

ISYE-6501 Intro Analytics Modeling - Homework

Beoordeling
-
Verkocht
-
Pagina's
14
Cijfer
A+
Geüpload op
07-03-2022
Geschreven in
2022/2023

ISYE-6501 Intro Analytics Modeling - Homework

Instelling
Vak

Voorbeeld van de inhoud

GATech OMS - Intro Analytics Modeling - ISYE-6501

Week3 - Homework 3

Carlos André da Costa Sol

September 10th, 2019

Question 5.1

Using crime data from the file uscrime.txt
(http://www.statsci.org/data/general/uscrime.txt, description at
http://www.statsci.org/data/general/uscrime.html), test to see whether there are any
outliers in the last column (number of crimes per 100,000 people). Use the
grubbs.test function in the outliers package in R.

Answer:

Firstly, I explore data using summary, p-value and box-plot graph.

The summary of this column (df$Crime) is:

summary(df$Crime)

Min. 1st Qu. Median Mean 3rd Qu. Max.

342.0 658.5 831.0 905.1 1057.5 1993.0

The p-value is: 0.07887486

The Box-plot graph shows some potential outliers:

, Then, using Grubbs test to realize about the outlier, it shows that the highest value
1993 is an outlier.
Grubbs test for one outlier

data: crimes
G = 2.81287, U = 0.82426, p-value = 0.07887
alternative hypothesis: highest value 1993 is an outlier


Ansd also, exploring the column data again, we see that 1993 is the clearest outlier,
with 1969 being a close second.

> df$Crime[0:10]

[1] 791 1635 578 1969 1234 682 963 1555 856 705




Code:

File HW3_V5.R question 5.1 has complete code to solve the case. And is copied
here.

find_outlier = function(data, col_x){

#test to see whether there are any outliers in the last column (number of crimes per
100,000 people)

crimes <- as.numeric (col_x)

crime_result <- grubbs.test(crimes)



return (crime_result)

}



df <- read.delim("~/Homework/L5-6/HW3/uscrime.txt", header=TRUE)

#find and see outlier

auxr <- find_outlier(df, df$Crime)

# Verify statiscts summary and visualize

summary(df$Crime)

plot(df$Crime)

Geschreven voor

Vak

Documentinformatie

Geüpload op
7 maart 2022
Aantal pagina's
14
Geschreven in
2022/2023
Type
Tentamen (uitwerkingen)
Bevat
Vragen en antwoorden

Onderwerpen

$10.99
Krijg toegang tot het volledige document:

Verkeerd document? Gratis ruilen Binnen 14 dagen na aankoop en voor het downloaden kan je een ander document kiezen. Je kan het bedrag gewoon opnieuw besteden.
Geschreven door studenten die geslaagd zijn
Direct beschikbaar na je betaling
Online lezen of als PDF

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
DUKETEST Miami Dade College
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
412
Lid sinds
5 jaar
Aantal volgers
390
Documenten
0
Laatst verkocht
1 jaar geleden
PATOCUTIE ACADEMICS

Get everything you need,NO STRESS

4.5

153 beoordelingen

5
124
4
6
3
11
2
4
1
8

Populaire documenten

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via Bancontact, iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo eenvoudig kan het zijn.”

Alisha Student

Veelgestelde vragen