1. 주어진 Market 데이터 셋에서 각 거래소 별 데이터는 All Exchange에 포함되어 있기 때문에 사용하지 않았다.
- Funding-Rates, Liquidations, Open-Interest, Buy-Sell-Stats 데이터들은 각 거래소 데이터 셋도 포함되어 있지만, 이는 전체 비트코인 데이터를 대표하지 못하기 때문에 All Exchange 데이터만 사용한다.
2. Network 데이터는 논리적으로 비트코인 시장 가격과 연관성이 있다고 생각하는 데이터를 추론한 뒤 target과의 연관성을 파악해서 feature enginnering을 한다.
- hashrate
- utxo_count & transactions_count_total
- **estimated_block_reward(**fees_block_mean_usd / fees_reward_percent)
3. Market 데이터는 1번에서 걸러진 데이터들을 제외하고, 각 영역에서 대표성을 가진 데이터들을 피처 엔지니어링을 통해 최대한 활용한다.
- funding_rates
- taker_buy_sell_stats
- coinbase_premium_index
- liquidations
- open_interest
4. 추가적으로 여러 피처들을 조합해서 새로운 피처 생성
(최종 제출 기준 XGBoost 모델에서만 추가로 활용)
- average_transaction_value(tokens-transferred_total / transactions_count_total)
- network_load(block_bytes / block_count)