Spaces:

valory
/

trader_agents_performance

Running

App Files Files Community

cyberosa commited on Jan 10

Commit

f26bf5c

1 Parent(s): 8a73d91

daily data of current week

Browse files

Files changed (5) hide show

data/closed_markets_div.parquet +2 -2
data/unknown_daily_traders.parquet +2 -2
data/unknown_traders.parquet +2 -2
data/weekly_mech_calls.parquet +2 -2
scripts/wow_retentions.py +141 -0

data/closed_markets_div.parquet CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f6b6ff11a79e22ddcfcc3e24305ed6a0892e06888254b6360e89e2ad956529a1
-size 52009

 version https://git-lfs.github.com/spec/v1
+oid sha256:99b7ff8fafd742e4c7b4601adb95bd42cf560d6a81ac97819ea5748a6ba4b900
+size 50378

data/unknown_daily_traders.parquet CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1480859c96b05ac94e54f2a69c0ad46d3b840c37111051bb2a0174aa60d90a73
-size 25003

 version https://git-lfs.github.com/spec/v1
+oid sha256:c74aad2a1150163d78233e9a54ffa262d195e43b68b9aba1e33536671075ef57
+size 163247

data/unknown_traders.parquet CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3620eaba76778060f41059fb2b6ff6e92a6000eedfd9a9119b703f84cdda11ff
-size 194084

 version https://git-lfs.github.com/spec/v1
+oid sha256:9be58c1de361e7c9df25ae05c54b77f6a6417e58e19d5d6ef8bd37516da1f70e
+size 198407

data/weekly_mech_calls.parquet CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:04536d62dc403476e4b21032b86e781f38aab5c08d69ebc9ccc917e005b9af95
-size 50976

 version https://git-lfs.github.com/spec/v1
+oid sha256:a91eccf4392fc1cbdbb911fa2163a5aff3f4483692ab059083492047c3a4f55a
+size 50574

scripts/wow_retentions.py ADDED Viewed

	@@ -0,0 +1,141 @@

+import pandas as pd
+from datetime import datetime, timedelta
+from utils import DATA_DIR
+# Basic Week over Week Retention
+def calculate_wow_retention(
+    traders_df: pd.DataFrame, trader_filter: str
+) -> pd.DataFrame:
+    """Function to compute the wow retention at the week level"""
+    if trader_filter == "Olas":
+        df = traders_df.loc[traders_df["staking"] != "non_Olas"]
+    elif trader_filter == "non_Olas":
+        df = traders_df.loc[traders_df["staking"] == "non_Olas"]
+    else:
+        # unknown traders
+        print("Not implemented yet")
+    # Get unique traders per week
+    weekly_traders = (
+        df.groupby("month_year_week")["trader_address"].nunique().reset_index()
+    )
+    # Calculate retention
+    retention = []
+    for i in range(1, len(weekly_traders)):
+        current_week = weekly_traders.iloc[i]["month_year_week"]
+        previous_week = weekly_traders.iloc[i - 1]["month_year_week"]
+        # Get traders in both weeks
+        current_traders = set(
+            df[df["month_year_week"] == current_week]["trader_address"]
+        )
+        previous_traders = set(
+            df[df["month_year_week"] == previous_week]["trader_address"]
+        )
+        retained = len(current_traders.intersection(previous_traders))
+        retention_rate = (retained / len(previous_traders)) * 100
+        retention.append(
+            {
+                "month_year_week": current_week,
+                "retained_traders": retained,
+                "previous_traders": len(previous_traders),
+                "retention_rate": retention_rate,
+            }
+        )
+    return pd.DataFrame(retention)
+# N-Week Rolling Retention
+def calculate_nweek_retention(df: pd.DataFrame, n_weeks=4):
+    # Get first and last trade for each trader
+    trader_activity = (
+        df.groupby("trader_address")
+        .agg({"creation_timestamp": ["min", "max"]})
+        .reset_index()
+    )
+    trader_activity.columns = ["trader_address", "first_trade", "last_trade"]
+    trader_activity["weeks_active"] = (
+        pd.to_datetime(trader_activity["last_trade"])
+        - pd.to_datetime(trader_activity["first_trade"])
+    ).dt.days / 7
+    return {
+        "total_traders": len(trader_activity),
+        f"{n_weeks}_week_retained": len(
+            trader_activity[trader_activity["weeks_active"] >= n_weeks]
+        ),
+        "retention_rate": (
+            len(trader_activity[trader_activity["weeks_active"] >= n_weeks])
+            / len(trader_activity)
+        )
+        * 100,
+    }
+# Cohort Retention
+def calculate_cohort_retention(df, max_weeks=12):
+    # Get first week for each trader
+    # TODO check if first will retrieve the first week of the data or not
+    first_trades = (
+        df.groupby("trader_address")
+        .agg({"creation_timestamp": "min", "month_year_week": "first"})
+        .reset_index()
+    )
+    first_trades.columns = ["trader_address", "first_trade", "cohort_week"]
+    # Get ordered list of unique weeks - converting to datetime for proper sorting
+    all_weeks = df["month_year_week"].unique()
+    weeks_datetime = pd.to_datetime(all_weeks)
+    sorted_weeks_idx = weeks_datetime.argsort()
+    all_weeks = all_weeks[sorted_weeks_idx]
+    # Create mapping from week string to numeric index
+    week_to_number = {week: idx for idx, week in enumerate(all_weeks)}
+    # Merge back to get all activities
+    cohort_data = pd.merge(
+        df, first_trades[["trader_address", "cohort_week"]], on="trader_address"
+    )
+    # Calculate week number since first activity
+    cohort_data["cohort_number"] = cohort_data["cohort_week"].map(week_to_number)
+    cohort_data["activity_number"] = cohort_data["month_year_week"].map(week_to_number)
+    cohort_data["week_number"] = (
+        cohort_data["activity_number"] - cohort_data["cohort_number"]
+    )
+    # Calculate retention by cohort
+    cohort_sizes = cohort_data.groupby("cohort_week")["trader_address"].nunique()
+    retention_matrix = cohort_data.groupby(["cohort_week", "week_number"])[
+        "trader_address"
+    ].nunique()
+    retention_matrix = retention_matrix.unstack(fill_value=0)
+    # Convert to percentages
+    retention_matrix = retention_matrix.div(cohort_sizes, axis=0) * 100
+    # Limit to max_weeks if specified
+    if max_weeks is not None and max_weeks < retention_matrix.shape[1]:
+        retention_matrix = retention_matrix.iloc[:, :max_weeks]
+    return retention_matrix.round(2)
+if __name__ == "__main__":
+    # read trades dataset
+    trades_df = pd.read_parquet(DATA_DIR / "all_trades_profitability.parquet")
+    # First, create week numbers from timestamps
+    trades_df["creation_timestamp"] = pd.to_datetime(trades_df["creation_timestamp"])
+    trades_df = trades_df.sort_values(by="creation_timestamp", ascending=True)
+    trades_df["month_year_week"] = (
+        trades_df["creation_timestamp"].dt.to_period("W").dt.strftime("%b-%d-%Y")
+    )
+    # Usage example:
+    wow_retention = calculate_wow_retention(trades_df, trader_filter="Olas")
+    rolling_retention = calculate_nweek_retention(trades_df, n_weeks=4)
+    cohort_retention = calculate_cohort_retention(trades_df)