본문 바로가기
반응형

분류 전체보기33

[논문 리뷰] A Comprehensive Survey of Multiagent Reinforcement Learning 2008년에 쓰인 글이지만 MARL의 큰 틀을 잡고 자 정리해보았다. A Comprehensive Survey of Multiagent Reinforcement Learning Benefits and Challenges in MARL Benefits agent끼리 경험을 공유하면 비슷한 task를 수행하는 경우 서로에게 도움이 된다. Challenges 차원의 저주 agent끼리의 상관관계 때문에 서로 학습에 방해가 될 수 있다. agent들이 계속 action을 취하고 이에 따라 environment가 변하기 때문에 nonstationary 상태가 된다. environment 뿐만 아니라 other agents도 고려해야 함 MARL GOAL Stability ➡️ dynamic environments.. 2023. 3. 10.
기획멘토링 22.04.06 방요셉 멘토님 프로젝트 진행과정 → 자료조사 ⇒ 대학원, 통계청을 활용 / 민간 자료조사 : 신뢰가 가는 조사기관을 쓸 것 → 페르소나에 해당하는 사용자들에게 인터뷰를 해볼 것 → 중간평가쯤에 관련 전문가들의 인터뷰같은 걸 따와서 사업성을 어필할 것 → 법률 이슈 : 크롤링 ⇒ 미리 알아보고 방어할 것 → 진행되는 발표마다 성능개선 어필 → 특허 출원 좋아함 → 시장성분석: 유사서비스 시장조사 TAM → SAM → SOM SOM 당장 돈을 벌 수 있는 시장 SAM 유효시장(잠재시장) TAM 전체시장 유사서비스들 분석 사람인, 잡코리아 등에 공개적으로 영업이익, 매출액등을 확인할 수 있다. 기획의 완성도가 낮아지는 이유 기술 개발의 성공 가능성이 낮다. 어떤 프레임워크가 좋은지 어떤 라이브.. 2023. 3. 8.
network 기초 데이터 통신이란 컴퓨터와 컴퓨터가 데이터를 주고받는 것을 데이터 통신 이라 함 데이터 통신을 하기 위해서는 기기와 프로토콜이 필요 기기는 컴퓨터, 인터페이스, 통신매체 등을 가르킴 프로토콜은 데이터 통신상의 규칙을 말함 네트워크 노드들이 자원을 공유할 수 있게 하는 디지털 전기통신망의 하나 분산되어 있는 컴퓨터를 통신망으로 연결 네트워크에서 컴퓨팅 장치들은 노드 간 연결(데이터 링크)을 사용하여 서로에게 데이터를 교환한다. 데이터를 출발시키고 라우팅시키고 종단시키는 네트워크 컴퓨터 장치들은 네트워크 노드로 부른다. → 네트워크 노드: 자원을 공유하는 행위를 하는 '것' 노드들은 개인용 컴퓨터, 전화, 서버, 네트워크 하드웨어와 같은 호스트를 포함할 수 있다. 이 두 장치들은 서로 직접 연결.. 2023. 3. 8.
[Wifi] Learning-Based Spatial Reuse for WLANs With Early Identification of Interfering Transmitters Learning-Based Spatial Reuse for WLANs With Early Identification of Interfering Transmitters Preliminaries: Early Identification of Interfering Transmitters State Using MDP four tuple $(\Omega, \Alpha, q, R)$ union and the Cartesian product $\Omega_{\text{MAC}} := {S_0, S_1, S_2, S_3}$ $\Omega_{\text{BS}}$ the current backoff stage the times of consecutive transmission failure at present $\Omega.. 2023. 3. 7.
728x90