{ "metadata": { "name": "", "signature": "sha256:c23fe55a5cb0859c9a2553bc7229cd39c6922503474091837f0bacaf572dc8e2" }, "nbformat": 3, "nbformat_minor": 0, "worksheets": [ { "cells": [ { "cell_type": "code", "collapsed": false, "input": [ "import pandas as pd\n", "loansData = pd.read_csv('http://spark-public.s3.amazonaws.com/dataanalysis/loansData.csv')" ], "language": "python", "metadata": {}, "outputs": [], "prompt_number": 2 }, { "cell_type": "code", "collapsed": false, "input": [ "loansData['Interest.Rate'][0:5]" ], "language": "python", "metadata": {}, "outputs": [ { "metadata": {}, "output_type": "pyout", "prompt_number": 3, "text": [ "81174 8.90%\n", "99592 12.12%\n", "80059 21.98%\n", "15825 9.99%\n", "33182 11.71%\n", "Name: Interest.Rate, dtype: object" ] } ], "prompt_number": 3 }, { "cell_type": "code", "collapsed": false, "input": [ "/Users/nitin/dl/mangodata.csv" ], "language": "python", "metadata": {}, "outputs": [] }, { "cell_type": "code", "collapsed": false, "input": [ "mangoData = pd.read_csv('/Users/nitin/dl/mangodata.csv')" ], "language": "python", "metadata": {}, "outputs": [], "prompt_number": 4 }, { "cell_type": "code", "collapsed": false, "input": [ "mangoData" ], "language": "python", "metadata": {}, "outputs": [ { "html": [ "
\n", " | date | \n", "med | \n", "scheduled | \n", "actual | \n", "
---|---|---|---|---|
0 | \n", "4/14/13 | \n", "lisinopril | \n", "8:00 | \n", "8:01 | \n", "
1 | \n", "4/15/13 | \n", "lisinopril | \n", "8:00 | \n", "8:10 | \n", "
2 | \n", "4/16/13 | \n", "lisinopril | \n", "8:00 | \n", "8:02 | \n", "
3 | \n", "4/17/13 | \n", "lisinopril | \n", "8:00 | \n", "8:01 | \n", "
4 | \n", "4/18/13 | \n", "lisinopril | \n", "8:00 | \n", "7:54 | \n", "
5 | \n", "4/19/13 | \n", "lisinopril | \n", "8:00 | \n", "8:03 | \n", "
6 | \n", "4/20/13 | \n", "lisinopril | \n", "8:00 | \n", "7:51 | \n", "
7 | \n", "4/21/13 | \n", "lisinopril | \n", "8:00 | \n", "8:01 | \n", "
8 | \n", "4/22/13 | \n", "lisinopril | \n", "8:00 | \n", "8:13 | \n", "
9 | \n", "4/23/13 | \n", "lisinopril | \n", "8:00 | \n", "8:14 | \n", "
10 | \n", "4/23/13 | \n", "atorvastatin | \n", "17:00 | \n", "17:14 | \n", "
11 | \n", "4/24/13 | \n", "lisinopril | \n", "8:00 | \n", "7:51 | \n", "
12 | \n", "4/24/13 | \n", "atorvastatin | \n", "17:00 | \n", "18:03 | \n", "
13 | \n", "4/25/13 | \n", "lisinopril | \n", "8:00 | \n", "8:10 | \n", "
14 | \n", "4/25/13 | \n", "atorvastatin | \n", "17:00 | \n", "NaN | \n", "
15 | \n", "4/26/13 | \n", "lisinopril | \n", "8:00 | \n", "8:19 | \n", "
16 | \n", "4/26/13 | \n", "atorvastatin | \n", "17:00 | \n", "17:28 | \n", "
17 | \n", "4/27/13 | \n", "lisinopril | \n", "8:00 | \n", "8:05 | \n", "
18 | \n", "4/27/13 | \n", "atorvastatin | \n", "17:00 | \n", "18:01 | \n", "
19 | \n", "4/28/13 | \n", "lisinopril | \n", "8:00 | \n", "8:17 | \n", "
20 | \n", "4/28/13 | \n", "atorvastatin | \n", "17:00 | \n", "18:03 | \n", "
21 | \n", "4/29/13 | \n", "lisinopril | \n", "8:00 | \n", "8:30 | \n", "
22 | \n", "4/29/13 | \n", "atorvastatin | \n", "17:00 | \n", "NaN | \n", "
23 | \n", "4/30/13 | \n", "lisinopril | \n", "8:00 | \n", "NaN | \n", "
24 | \n", "4/30/13 | \n", "atorvastatin | \n", "17:00 | \n", "17:24 | \n", "
25 | \n", "5/1/13 | \n", "lisinopril | \n", "8:00 | \n", "8:29 | \n", "
26 | \n", "5/1/13 | \n", "atorvastatin | \n", "17:00 | \n", "17:46 | \n", "
27 | \n", "5/2/13 | \n", "lisinopril | \n", "8:00 | \n", "8:13 | \n", "
28 | \n", "5/2/13 | \n", "atorvastatin | \n", "17:00 | \n", "17:28 | \n", "
29 | \n", "5/3/13 | \n", "lisinopril | \n", "8:00 | \n", "8:08 | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
585 | \n", "5/22/14 | \n", "atorvastatin | \n", "8:00 | \n", "9:58 | \n", "
586 | \n", "5/23/14 | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
587 | \n", "5/24/14 | \n", "atorvastatin | \n", "8:00 | \n", "10:14 | \n", "
588 | \n", "5/25/14 | \n", "atorvastatin | \n", "8:00 | \n", "8:05 | \n", "
589 | \n", "5/26/14 | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
590 | \n", "5/27/14 | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
591 | \n", "5/28/14 | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
592 | \n", "5/29/14 | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
593 | \n", "5/30/14 | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
594 | \n", "5/31/14 | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
595 | \n", "6/1/14 | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
596 | \n", "6/2/14 | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
597 | \n", "6/3/14 | \n", "atorvastatin | \n", "8:00 | \n", "7:57 | \n", "
598 | \n", "6/4/14 | \n", "atorvastatin | \n", "8:00 | \n", "9:24 | \n", "
599 | \n", "6/5/14 | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
600 | \n", "6/6/14 | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
601 | \n", "6/7/14 | \n", "atorvastatin | \n", "8:00 | \n", "9:21 | \n", "
602 | \n", "6/8/14 | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
603 | \n", "6/9/14 | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
604 | \n", "6/10/14 | \n", "atorvastatin | \n", "8:00 | \n", "9:06 | \n", "
605 | \n", "6/11/14 | \n", "atorvastatin | \n", "8:00 | \n", "8:40 | \n", "
606 | \n", "6/12/14 | \n", "atorvastatin | \n", "8:00 | \n", "10:07 | \n", "
607 | \n", "6/13/14 | \n", "atorvastatin | \n", "8:00 | \n", "9:59 | \n", "
608 | \n", "6/14/14 | \n", "atorvastatin | \n", "8:00 | \n", "8:02 | \n", "
609 | \n", "6/15/14 | \n", "atorvastatin | \n", "8:00 | \n", "10:55 | \n", "
610 | \n", "6/16/14 | \n", "atorvastatin | \n", "8:00 | \n", "9:00 | \n", "
611 | \n", "6/17/14 | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
612 | \n", "6/18/14 | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
613 | \n", "6/19/14 | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
614 | \n", "6/20/14 | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
615 rows \u00d7 4 columns
\n", "\n", " | date | \n", "dow | \n", "med | \n", "scheduled | \n", "actual | \n", "
---|---|---|---|---|---|
0 | \n", "4/14/2013 | \n", "sunday | \n", "lisinopril | \n", "8:00 | \n", "8:01 | \n", "
1 | \n", "4/15/2013 | \n", "monday | \n", "lisinopril | \n", "8:00 | \n", "8:10 | \n", "
2 | \n", "4/16/2013 | \n", "tuesday | \n", "lisinopril | \n", "8:00 | \n", "8:02 | \n", "
3 | \n", "4/17/2013 | \n", "wednesday | \n", "lisinopril | \n", "8:00 | \n", "8:01 | \n", "
4 | \n", "4/18/2013 | \n", "thursday | \n", "lisinopril | \n", "8:00 | \n", "7:54 | \n", "
5 | \n", "4/19/2013 | \n", "friday | \n", "lisinopril | \n", "8:00 | \n", "8:03 | \n", "
6 | \n", "4/20/2013 | \n", "saturday | \n", "lisinopril | \n", "8:00 | \n", "7:51 | \n", "
7 | \n", "4/21/2013 | \n", "sunday | \n", "lisinopril | \n", "8:00 | \n", "8:01 | \n", "
8 | \n", "4/22/2013 | \n", "monday | \n", "lisinopril | \n", "8:00 | \n", "8:13 | \n", "
9 | \n", "4/23/2013 | \n", "tuesday | \n", "lisinopril | \n", "8:00 | \n", "8:14 | \n", "
10 | \n", "4/24/2013 | \n", "wednesday | \n", "lisinopril | \n", "8:00 | \n", "7:51 | \n", "
11 | \n", "4/25/2013 | \n", "thursday | \n", "lisinopril | \n", "8:00 | \n", "8:10 | \n", "
12 | \n", "4/26/2013 | \n", "friday | \n", "lisinopril | \n", "8:00 | \n", "8:19 | \n", "
13 | \n", "4/27/2013 | \n", "saturday | \n", "lisinopril | \n", "8:00 | \n", "8:05 | \n", "
14 | \n", "4/28/2013 | \n", "sunday | \n", "lisinopril | \n", "8:00 | \n", "8:17 | \n", "
15 | \n", "4/29/2013 | \n", "monday | \n", "lisinopril | \n", "8:00 | \n", "8:30 | \n", "
16 | \n", "4/30/2013 | \n", "tuesday | \n", "lisinopril | \n", "8:00 | \n", "NaN | \n", "
17 | \n", "5/1/2013 | \n", "wednesday | \n", "lisinopril | \n", "8:00 | \n", "8:29 | \n", "
18 | \n", "5/2/2013 | \n", "thursday | \n", "lisinopril | \n", "8:00 | \n", "8:13 | \n", "
19 | \n", "5/3/2013 | \n", "friday | \n", "lisinopril | \n", "8:00 | \n", "8:08 | \n", "
20 | \n", "5/4/2013 | \n", "saturday | \n", "lisinopril | \n", "8:00 | \n", "8:22 | \n", "
21 | \n", "5/5/2013 | \n", "sunday | \n", "lisinopril | \n", "8:00 | \n", "8:17 | \n", "
22 | \n", "5/6/2013 | \n", "monday | \n", "lisinopril | \n", "8:00 | \n", "8:12 | \n", "
23 | \n", "5/7/2013 | \n", "tuesday | \n", "lisinopril | \n", "8:00 | \n", "8:15 | \n", "
24 | \n", "5/8/2013 | \n", "wednesday | \n", "lisinopril | \n", "8:00 | \n", "8:13 | \n", "
25 | \n", "5/9/2013 | \n", "thursday | \n", "lisinopril | \n", "8:00 | \n", "8:02 | \n", "
26 | \n", "5/10/2013 | \n", "friday | \n", "lisinopril | \n", "8:00 | \n", "8:02 | \n", "
27 | \n", "5/11/2013 | \n", "saturday | \n", "lisinopril | \n", "8:00 | \n", "8:11 | \n", "
28 | \n", "5/12/2013 | \n", "sunday | \n", "lisinopril | \n", "8:00 | \n", "8:28 | \n", "
29 | \n", "5/13/2013 | \n", "monday | \n", "lisinopril | \n", "8:00 | \n", "NaN | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
585 | \n", "5/22/2014 | \n", "friday | \n", "atorvastatin | \n", "8:00 | \n", "9:58 | \n", "
586 | \n", "5/23/2014 | \n", "saturday | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
587 | \n", "5/24/2014 | \n", "sunday | \n", "atorvastatin | \n", "8:00 | \n", "10:14 | \n", "
588 | \n", "5/25/2014 | \n", "monday | \n", "atorvastatin | \n", "8:00 | \n", "8:05 | \n", "
589 | \n", "5/26/2014 | \n", "tuesday | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
590 | \n", "5/27/2014 | \n", "wednesday | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
591 | \n", "5/28/2014 | \n", "thursday | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
592 | \n", "5/29/2014 | \n", "friday | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
593 | \n", "5/30/2014 | \n", "saturday | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
594 | \n", "5/31/2014 | \n", "sunday | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
595 | \n", "6/1/2014 | \n", "monday | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
596 | \n", "6/2/2014 | \n", "tuesday | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
597 | \n", "6/3/2014 | \n", "wednesday | \n", "atorvastatin | \n", "8:00 | \n", "7:57 | \n", "
598 | \n", "6/4/2014 | \n", "thursday | \n", "atorvastatin | \n", "8:00 | \n", "9:24 | \n", "
599 | \n", "6/5/2014 | \n", "friday | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
600 | \n", "6/6/2014 | \n", "saturday | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
601 | \n", "6/7/2014 | \n", "sunday | \n", "atorvastatin | \n", "8:00 | \n", "9:21 | \n", "
602 | \n", "6/8/2014 | \n", "monday | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
603 | \n", "6/9/2014 | \n", "tuesday | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
604 | \n", "6/10/2014 | \n", "wednesday | \n", "atorvastatin | \n", "8:00 | \n", "9:06 | \n", "
605 | \n", "6/11/2014 | \n", "thursday | \n", "atorvastatin | \n", "8:00 | \n", "8:40 | \n", "
606 | \n", "6/12/2014 | \n", "friday | \n", "atorvastatin | \n", "8:00 | \n", "10:07 | \n", "
607 | \n", "6/13/2014 | \n", "saturday | \n", "atorvastatin | \n", "8:00 | \n", "9:59 | \n", "
608 | \n", "6/14/2014 | \n", "sunday | \n", "atorvastatin | \n", "8:00 | \n", "8:02 | \n", "
609 | \n", "6/15/2014 | \n", "monday | \n", "atorvastatin | \n", "8:00 | \n", "10:55 | \n", "
610 | \n", "6/16/2014 | \n", "tuesday | \n", "atorvastatin | \n", "8:00 | \n", "9:00 | \n", "
611 | \n", "6/17/2014 | \n", "wednesday | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
612 | \n", "6/18/2014 | \n", "thursday | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
613 | \n", "6/19/2014 | \n", "friday | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
614 | \n", "6/20/2014 | \n", "saturday | \n", "atorvastatin | \n", "8:00 | \n", "NaN | \n", "
615 rows \u00d7 5 columns
\n", "\n", " | date | \n", "dow | \n", "med | \n", "scheduled | \n", "actual | \n", "
---|---|---|---|---|---|
0 | \n", "4/14/2013 | \n", "sunday | \n", "lisinopril | \n", "8:00 | \n", "8:01 | \n", "
1 | \n", "4/15/2013 | \n", "monday | \n", "lisinopril | \n", "8:00 | \n", "8:10 | \n", "
2 | \n", "4/16/2013 | \n", "tuesday | \n", "lisinopril | \n", "8:00 | \n", "8:02 | \n", "
3 | \n", "4/17/2013 | \n", "wednesday | \n", "lisinopril | \n", "8:00 | \n", "8:01 | \n", "
4 | \n", "4/18/2013 | \n", "thursday | \n", "lisinopril | \n", "8:00 | \n", "7:54 | \n", "