jaebradley · PGatts · Sep 28, 2024 · Dec 16, 2024 · jaebradley · Nov 20, 2024
diff --git a/basketball_reference_web_scraper/client.py b/basketball_reference_web_scraper/client.py
@@ -1,6 +1,6 @@
 import requests
 
-from basketball_reference_web_scraper.errors import InvalidSeason, InvalidDate, InvalidPlayerAndSeason
+from basketball_reference_web_scraper.errors import InvalidSeason, InvalidDate, InvalidPlayerAndSeason, InvalidTeam
 from basketball_reference_web_scraper.http_service import HTTPService
 from basketball_reference_web_scraper.output.columns import BOX_SCORE_COLUMN_NAMES, SCHEDULE_COLUMN_NAMES, \
     PLAYER_SEASON_TOTALS_COLUMN_NAMES, \
@@ -11,8 +11,8 @@
 from basketball_reference_web_scraper.output.writers import CSVWriter, JSONWriter, FileOptions, OutputOptions, \
     SearchCSVWriter
 from basketball_reference_web_scraper.parser_service import ParserService
-
-
+from datetime import datetime
+from basketball_reference_web_scraper.data import TEAM_TO_TEAM_ABBREVIATION
 def standings(season_end_year, output_type=None, output_file_path=None, output_write_option=None,
               json_options=None):
     try:
@@ -212,6 +212,35 @@ def team_box_scores(day, month, year, output_type=None, output_file_path=None, o
     )
     return output_service.output(data=values, options=options)
 
+def get_roster(team, year=None, output_type=None, output_file_path=None, output_write_option=None, json_options=None):
+    try:
+        http_service = HTTPService(parser=ParserService())
+        if year == None:
+            today = datetime.now()
+            year = today.year
+            if today.month >=7:
+                year += 1
+        if len(team) > 3:
+            team=TEAM_TO_TEAM_ABBREVIATION[team.upper()]
+        values=http_service.get_team_roster(team=team, year=year)
+    except requests.exceptions.HTTPError as http_error:
+        if http_error.response.status_code == requests.codes.not_found:
+            raise InvalidTeam(team=team, year=year)
+        else:
+            raise http_error
+
+    options = OutputOptions.of(
+        file_options=FileOptions.of(path=output_file_path, mode=output_write_option),
+        output_type=output_type,
+        json_options=json_options,
+        csv_options={"column_names": "Players"}
+    )
+
+    output_service = OutputService(
+        json_writer=JSONWriter(value_formatter=BasketballReferenceJSONEncoder),
+        csv_writer=CSVWriter(value_formatter=format_value)
+    )
+    return output_service.output(data=values, options=options)
 
 def play_by_play(home_team, day, month, year, output_type=None, output_file_path=None, output_write_option=None,
                  json_options=None):
@@ -250,3 +279,5 @@ def search(term, output_type=None, output_file_path=None, output_write_option=No
         csv_writer=SearchCSVWriter(value_formatter=format_value)
     )
     return output_service.output(data=values, options=options)
+
+
diff --git a/basketball_reference_web_scraper/errors.py b/basketball_reference_web_scraper/errors.py
@@ -20,3 +20,8 @@ def __init__(self, player_identifier, season_end_year):
         message = "Player with identifier \"{player_identifier}\" in season ending in {season_end_year} is invalid" \
             .format(player_identifier=player_identifier, season_end_year=season_end_year)
         super().__init__(message)
+
+class InvalidTeam(Exception):
+    def __init__(self, team, year):
+        message = "Team \"{team}\" in {year} is invalid".format(team=team, year=year)
+        super().__init__(message)
diff --git a/basketball_reference_web_scraper/html.py b/basketball_reference_web_scraper/html.py
@@ -870,6 +870,17 @@ def game_url_paths(self):
         game_links = self.html.xpath(self.game_url_paths_query)
         return [game_link.attrib['href'] for game_link in game_links]
 
+class TeamRoster:
+    def __init__(self, html):
+        self.html = html
+
+    @property
+    def roster_query(self):
+        return '//table[@id="roster"]//td[@data-stat="player"]'
+    @property
+    def team_roster(self):
+        players = self.html.xpath(self.roster_query)
+        return [player.text_content() for player in players]
 
 class SchedulePage:
     def __init__(self, html):

diff --git a/basketball_reference_web_scraper/http_service.py b/basketball_reference_web_scraper/http_service.py
@@ -1,11 +1,13 @@
+from datetime import datetime, timezone
+
 import requests
 from lxml import html
 
 from basketball_reference_web_scraper.data import TEAM_TO_TEAM_ABBREVIATION, TeamTotal, PlayerData
 from basketball_reference_web_scraper.errors import InvalidDate, InvalidPlayerAndSeason
 from basketball_reference_web_scraper.html import DailyLeadersPage, PlayerSeasonBoxScoresPage, PlayerSeasonTotalTable, \
     PlayerAdvancedSeasonTotalsTable, PlayByPlayPage, SchedulePage, BoxScoresPage, DailyBoxScoresPage, SearchPage, \
-    PlayerPage, StandingsPage
+    PlayerPage, StandingsPage, TeamRoster
 
 
 class HTTPService:
@@ -194,6 +196,17 @@ def team_box_scores(self, day, month, year):
             for box_score in self.team_box_score(game_url_path=game_url_path)
         ]
 
+    def get_team_roster(self, team, year):
+        url = "{BASE_URL}/teams/{team}/{year}.html".format(BASE_URL=HTTPService.BASE_URL, team=team, year=year)
+
+        response = requests.get(url=url)
+
+        response.raise_for_status()
+
+        page = TeamRoster(html=html.fromstring(response.content))
+        return page.team_roster
+
+
     def search(self, term):
         response = requests.get(
             url="{BASE_URL}/search/search.fcgi".format(BASE_URL=HTTPService.BASE_URL),
@@ -240,3 +253,5 @@ def search(self, term):
         return {
             "players": player_results
         }
+
+
diff --git a/bin/normalizer b/bin/normalizer
@@ -1,4 +1,6 @@
-#!/Users/jaebradley/projects/basketball_reference_web_scraper/bin/python3
+#!/bin/sh
+'''exec' "/Users/paramgattupalli/Documents/Fall 2024/CEN 3031/basketball_reference_web_scraper/bin/python" "$0" "$@"
+' '''
 # -*- coding: utf-8 -*-
 import re
 import sys

diff --git a/bin/pip b/bin/pip
@@ -1,4 +1,6 @@
-#!/Users/jaebradley/projects/basketball_reference_web_scraper/bin/python3
+#!/bin/sh
+'''exec' "/Users/paramgattupalli/Documents/Fall 2024/CEN 3031/basketball_reference_web_scraper/bin/python" "$0" "$@"
+' '''
 # -*- coding: utf-8 -*-
 import re
 import sys

diff --git a/bin/pip3 b/bin/pip3
@@ -1,4 +1,6 @@
-#!/Users/jaebradley/projects/basketball_reference_web_scraper/bin/python3
+#!/bin/sh
+'''exec' "/Users/paramgattupalli/Documents/Fall 2024/CEN 3031/basketball_reference_web_scraper/bin/python" "$0" "$@"
+' '''
 # -*- coding: utf-8 -*-
 import re
 import sys