옵션?

우리가 셀레니움을 이용하는 대부분의 이유는 반복작업을 대체하기 위해 사용한다고 생각합니다.

단순한 반복작업을 하는데 굳이 브라우저가 눈에 보일 필요는 없겠죠

브라우저가 백그라운드에 존재하며 우리눈에 보이지 않더라도 작업은 계속 진행되게 하고 싶습니다

그리고 크롬드라이버프롬프트창도 숨기고 싶구요. gpu가속도 사용하기 싫고 안전한페이지검증절차도 거치기 싫을 수 있습니다. 이런 모든것들을 우리는 옵션설정을 통해 원하는 브라우저의 행동을 제어할 수 있습니다

 

 


너무 많은 옵션들

https://peter.sh/experiments/chromium-command-line-switches/

 

List of Chromium Command Line Switches « Peter Beverloo

 

peter.sh

해당 사이트에서 크롬의 명령문을 찾을 수 있습니다

하지만 너무 많죠? 자주사용되는 명령문만 다뤄보겠습니다

 

		_options = new ChromeOptions();

            //명령프롬프트 숨기기
            _driverService.HideCommandPromptWindow = true;

            //안전하지않은 페이지경고 무시하기
            _options.AddArgument("--ignore-certificate-errors");

            //gpu가속 비활성화
            _options.AddArgument("--disable-gpu");

            //브라우저 숨기기
            _options.AddArgument("--headless");

            //브라우저 사이즈조절. headless모드에서 사용하면 유용합니다
            _options.AddArgument("--window-size=1920,1080");

주석에 나와 있는대로 이해하시면 됩니다.

다만 추가 설명이 필요한곳이 window-size옵션인데 

특정 웹에서는 브라우저 사이즈가 작으면 웹 디자인이 변경되기도 합니다

나는 최대화된 브라우저를 기준으로 코드를 작성했는데

headless로 브라우저를 숨겨서 작동시키면 제대로 동작하지 않는 경우가 종종 생깁니다

이런 것을 방지하기 위해 브라우저를 숨겨서 작동시키지만 브라우저사이즈를 옵션으로 직접 늘려줍니다.

 

만약 명령프롬프트를 숨겼다면 해당코드를 프로그램종료전에 혹은 종료시 꼭 작동시켜주세요

_driver?.Quit();

프로그램을 종료한다고 크롬드라이버까지 자동으로 종료되지 않습니다.

드라이버를 종료하지 않았다면 프로그램을 종료해도 드라이버는 작업관리자에서 둥둥 떠다닙니다 조심하세요

참고로 코드에서 ?.는 null체크입니다

 

이제 코드를 실행해보시면 작업관리자에 크롬드라이버가 존재하지만 브라우저가 눈에 보이지 않을 것입니다.

지금은 연습단계이므로 이러한 옵션이 있다는 것을 염두하고

다음 포스트부터는 다시 옵션을 전부 제거하고 진행해보겠습니다

 

https://github.com/ForestBird1/TestSelenium.git

 

GitHub - ForestBird1/TestSelenium

Contribute to ForestBird1/TestSelenium development by creating an account on GitHub.

github.com

 


셀레니움?

웹 크롤링을 하기 위해 우리는 제공되는 라이브러리를 이용합니다

파이썬의 beutifulsoup처럼 말이죠

여기선 그중 Selenium, 언어는 C#, 크롬브라우저를 기준으로 다뤄보겠습니다

 

셀레니움은 웹 브라우저를 컨트롤하는 라이브러리라고 생각하시면 편합니다

이러한 셀레니움의 기능을 도움받아서 웹 크롤링이외에 비슷한 개념의 매크로를 만들수 있기 때문에

다룰줄안다면 나중에 웹 반복업무시 큰 도움이 될 것입니다

 


설치

비주얼 스튜디오의 Nuget으로 위의 3개의 패키지를 설치합니다

그리고 설치하면 안되는 패키지도 있는데요 아래 패키지는 주의해서 설치를 피하시면됩니다

구버전 크롬 웹드라이버

위의 패키지는 크롬85버전까지만 지원되고 2020년에 업데이트가 중단된 드라이버입니다

드라이버를 2개다 설치했다면 필히 버전에 맞게 하나 지워주세요

 


기본적인 작동법

//Selenium 
using OpenQA.Selenium;
using OpenQA.Selenium.Chrome;
using OpenQA.Selenium.Support.UI;

namespace TestSelenium
{
    public partial class TestSelenium : Form
    {
        //Selenum_Chrome
        private ChromeDriverService _driverService = ChromeDriverService.CreateDefaultService();
        private ChromeOptions _options = new ChromeOptions();
        private ChromeDriver _driver = null;
        private IWebElement _web_elem = null;

        public TestSelenium()
        {
            InitializeComponent();
        }

        private void button1_Click(object sender, EventArgs e)
        {
            //브라우저 창 생성
            _driver = new ChromeDriver(_driverService, _options);
        }
    }
}

상단 using문에 셀레니움 라이브러리를 추가후

셀레니움변수를 생성하시면됩니다

 

여기까지 진행하셨다면 브라우저가 생성되는 것 까지 보실 수 있습니다

 

이제 셀레니움을 이용할 모든 준비가 되었습니다!

다음 포스트부터 차근차근 셀레니움의 여러작동법을 올리겠습니다

 

 

https://github.com/ForestBird1/TestSelenium.git

 

GitHub - ForestBird1/TestSelenium

Contribute to ForestBird1/TestSelenium development by creating an account on GitHub.

github.com

 

https://github.com/ForestBird1/TimeClock.git

 

GitHub - ForestBird1/TimeClock: C#과 구글시트API로 만든 출퇴근기록기 입니다

C#과 구글시트API로 만든 출퇴근기록기 입니다. Contribute to ForestBird1/TimeClock development by creating an account on GitHub.

github.com

코드전체를 모두 볼 수 있게 깃으로 올려놨다

하루만에 짠 코드라서 하드코딩도 되어있는데 어차피 나만 쓸려고 만든거고

프로젝트의 목표는 구글api를 사용해보는 것이기 때문에 당분간은 그대로 쓰겠지만

다음달, 내년되서 구글시트의 출퇴근양식이 바뀌게 되면 그때 업데이트를 전체적으로 할 예정이다.

 

코드를 전부 보면서 설명하면 너무 길어지기 때문에 적당히 추려보겠다

 

시작하기전에 실제로 작동되는 시트내용이다

사실 보기가 좀 어렵다. 정확히는 익숙한 내눈에만 정보가 들어온다.

1~2달 정도 써보고 불편한점을 추려낸후 업데이트할 예정이다. 불편한게 없다면 그냥 쓰는거구..


private const int __MAX_BREAK_TIME = 5; // 최대 휴게횟수
public struct TimeClockData
{
public int access_row; // 엑세스된 행값
public string access_date; // 출근찍은 날짜
public string time_work_total; // 총 근무시간
public string time_work_start; // 출근시간
public string time_work_end; // 퇴근시간

public WorkStatus work_status; // 현재 업무상태(일,휴게시간,퇴근)

public string[] break_times; // 휴게시간(점심,저녁 등)
public int break_time_count; // 휴게시간 횟수(최대 횟수가 정해져있음)
}

 

8개의 변수로 모든것을 다 기록한다 

access_row

출근할 때마다 매번 마지막 행을 찾지않고 한행씩 추가할 때마다 그 행값을 계속 가지고 있는다. A1셀에 있는 값이다

access_data

만약 출근을 1일날하고 퇴근을 2일날하면 근무날짜의 기준을 어디로 잡아야할까 하다가 출근한 날짜를 기준으로 잡기로 했다. 30일날 출근하고 다음달 1일에 퇴근하면 30일 24시까지는 저번달로잡고 00시부터 퇴근까지는 이번달로 잡는등 이런것까지 내가 신경쓰기 싫어서 그랬다.

time_work_total

총 근무시간이다

근무시간 = 퇴근시간 - 출근시간 - 휴게시간들;

근무시간은 24시간을 넘기지 않을 거 같으니 시간만 표현했다

time_work_start,end

출퇴근 시간이다. 이것은 시간만 찍지 않은 이유는 1999년12월31일에 출근하고 2000년01월01일에 퇴근하면 년도까지 달라지고 하필 또 실제로 11월달인 지금은 연말에 가까워지기 때문에 출퇴근에는 년도까지 표시했다.

덕분에 가독성은 떨어지지만 뭐 지금은 내눈에는 잘 들어오고 불편한거 없으니 잘 쓰고 있다.

 

work_status

WorkStatus라는 enum을 만들어서 관리중인데 현재 근무상태를 표현해주고 있다

 

break_times

휴게시간을 기록하고 있다.

휴게시간은 점심, 저녁등 2번 이상의 값을 가지기 때문에 배열로 관리하고 있고 프로그램실행시 구조체를 초기화할 때 최대 휴게시간 횟수에 맞게 해당값의 크기도 초기화를 해준다.

fixed_array라서 더 휴게시간을 최대보다 더 가져갈 수도없다.

break_time_count

현재 휴게시간의 횟수


 

먼저 구글api는 한도가 정해져있다

분당 읽기요청량, 분당 쓰기요청량이 정해져 있어서 api는 너무 호출하면 안된다

어차피 이번 프로그램은 나 혼자 쓰는거고 매초마다 쓰는 프로그램이 아니라서 걱정할 필요는 없지만 그래도 프로그램을 작동할 때 마다 api를 사용하는것을 피하기 위해 api를 읽고 쓸때마다 .json에 데이터를 미리 저장해놓고 사용했다

 

private void JsonSave()
{
    //Json저장. Json에 데이터 입력
    JObject json_obj = new JObject
        (
        new JProperty("access_row", _time_clock_data.access_row),
        new JProperty("access_date", _time_clock_data.access_date),
        new JProperty("time_work_total", _time_clock_data.time_work_total),
        new JProperty("time_work_start", _time_clock_data.time_work_start),
        new JProperty("time_work_end", _time_clock_data.time_work_end),
        new JProperty("work_status", _time_clock_data.work_status.ToString()),
        new JProperty("break_time_count", _time_clock_data.break_time_count)
        );

    for (int i = 1; i <= __MAX_BREAK_TIME; ++i)
    {
        json_obj.Add("time_break_time_"+i.ToString(), _time_clock_data.break_times[i - 1]);
    }
    

    //파일로 저장
    File.WriteAllText(_data_time_clock, json_obj.ToString());
}

사실 여기서 실수를 방지하기 위해서는 하드코딩된 "access_row", "access_data"등은 변수로 빼버려야 하는데 에잇 귀찮다. 그냥 오른쪽에 _time_clock_data.~나오는 변수이름을 더블클릭해서 붙혀줬다. 나중에 값을 가져올 때도 똑같이 하면 된다.

 

당연하겠지만 누겟으로 Json을 설치해줬다.

 


프로그램을 처음 실행하면 private void PostInitApp() 함수가 호출되는데 함수 내용은 간단하게

 

데이터json파일 유무 확인

-있으면 json값을 토대로 데이터 초기화(api사용하지 않음)

-없으면 api로 필요한 값을 가져와 데이터 초기화후 json으로 저장(api사용)

 

이렇게 작동한다.

출근부터 퇴근까지 출퇴근 프로그램을 계속 켜놓으면 이렇게까지 할 필요도 없다. 차라리 api좀 더 쓰고 귀찮게 이렇게 json파일까지 만들면서 안하고, json은 어쨌든 텍스트파일이기때문에 파일자체를 수정해버리면 문제가 생기기 때문인데 실수든 뭐든 프로그램을 퇴근도 안찍고 꺼버릴 수 있고 이같은 행동은 여러번 일어날 수 있다. 그래서 프로그램을 킬 때마다 api로 데이터를 가져오지 않고 한번가져온 데이터는 저장하기 때문에 프로그램을 수만번 껐다켜도 api는 최초 단한번만 호출하게 된다.

당연히~ 지금은 나만써서 json파일을 건드리지 않기 때문에 가능한 일이다. 만약 많은 사람들이 쓰게되면 json파일의 잘못된 데이터를 감지하는 로직을 짜면된다.


사용자(나)의 실수를 줄이기 위해 현재 근무상태에 따라서 버튼을 활성화 및 비활성화 해주었다.

버튼만 보면 직관적으로 내가 지금 무슨 상태인지 알 수 있고 출근했는데 실수로 또 출근을 눌러버리는 대참사 또한 1차적으로 막을 수 있다.


고민되었던 부분

1.

나만 쓰게 땜에 상관없지만 api는 많이 호출하지 않는 쪽으로 한번 짜볼려고 했었다

우선 쓰기api는 단독셀 or 범위셀만 가능하다. 

그래서 떨어져있는 단독셀을 한번의 api호출로 되지 않는 다는 것이다

예를 들어서 A1,C1의 값만 바꾸고 싶은데 A1:C1으로 범위를 지정하면 B1이 범위에 들어가 있기 때문에 값이 변경된다는 것이다. 결국 A1과 C1따로 api를 호출해줘야 하는데 이걸 줄여보고 싶어서 "범위 중간에 이미 시트에 값이 있다면 덮어쓰지 않는다"라는 방법을 찾다찾다 포기했다.

프로그램 만들면서 이게 제일 시간을 많이 쓴듯하다.

어쩔수 없이 변경해야할 값들의 셀이 붙어있는지 확인하면서 코드를 작성했다. 

 

2.

이미 설명했지만 api를 여러번 호출하기 싫어서 json파일로 데이터를 관리 했다.

 

3.

휴게시간의 횟수는 사실 알수가 없다. 어떤날은 1번만 쉬고 어떤날은 100번쉴수도 있는거 아닌가? 그래서 배열로 관리 했다지만 구글시트에서 값을 가져올때 어느열까지 가져올지 고민되었다

A0~Z0까지 일단 다 가져오고 계산하는게 맞나?

그러면 배열을 쓰지 않고 List를 사용하나?

이런저런 고민끝에 그냥 최대 휴게시간을 정해줬다. 

나뿐만이 아니라 남들도 뭐 휴게시간을 100번가지는것은 그럴 수~도 있겠지만 사용자오류로 보는게 확률적으로 더 맞다고 생각해서 내 상식선에서 여유롭게 5번으로 제한을 주었다.

그러면 구글시트에서 휴게시간값을 가져올때 딱 필요한 열만 가져오고 필요한 배열의 사이즈만 할당해주면된다

 


마무리

api라는것을 처음 사용해보는데 가장 힘든부분은

1. api인증후 코드에서 사용하는 것까지

2. '효율적'으로 api호출

이 두가지가 제일 힘들었다.

이번 프로젝트는 나혼자 쓰는거라 그저 되는거에만 치중했기 때문에 어찌저찌 되었는데

혹여 다수가 사용하게 된다면 어떤 버그가 생기고 어떤 문제가 생기는지 궁금해진다.

 

나중에 프로그램이 업데이트하게 된다면 그부분만 다뤄서 다시 포스팅해보도록 하겠다

 

굿바이~

+ Recent posts