Entwerfen vertrauenswürdiger ML -Modelle: Alan & Aida Entdecken Sie die Monotonizität im maschinellen Lernen

Modelle für maschinelles Lernen sind leistungsstark, aber manchmal erzeugen sie Vorhersagen, die die menschliche Instinct brechen.

Stellen Sie sich das vor: Sie prognostizieren die Immobilienpreise. Ein 2.000 m² großes Haus ist billiger als ein Zuhause von 1.500 Quadratmetern. Klingt falsch, oder?

Hier Einschränkungen der Monotonizität Schritt in. Sie stellen sicher, dass die Modelle den erwarteten logischen Geschäftsregeln befolgen.

Folgen wir zwei Kollegen, Alan Und AidaAuf ihrer Reise, um herauszufinden, warum Monotizität im maschinellen Lernen wichtig ist.

Die Geschichte: Alan & Aidas Entdeckung

Alan ist ein praktischer Ingenieur. Aida ist ein prinzipieller Wissenschaftler. Gemeinsam bauen sie ein Modellpreisvorhersagemodell.

Alan zeigt AIDA stolz seine Modellergebnisse:

„Schau! R² ist großartig, der Fehler ist niedrig. Wir sind bereit zu bereitstellen!“

AIDA nimmt das Modell zum Testen heraus:

Für ein Haus mit 1500 sq ft → Modell prognostiziert 300.000 US -Greenback
Für ein Haus mit 2000 sq ft → Modell prognostiziert 280.000 US -Greenback 😮

Aida runzelt die Stirn, während sie sich die Vorhersagen ansieht:

„Warten Sie eine Sekunde … warum ist dieses 2.000 Quadratmeter große Haus billiger als ein 1.500 m² großes Zuhause? Das macht keinen Sinn.“

Alan zuckt mit den Schultern:

„Das liegt daran, dass das Modell Rauschen in den Trainingsdaten gefunden hat. Es ist nicht immer logisch. Aber die Genauigkeit ist insgesamt intestine. Ist das nicht genug?“

Aida schüttelt den Kopf:

„Nicht wirklich. Ein vertrauenswürdiges Modell muss nicht nur korrekt sein, sondern auch Logik folgen, die Menschen vertrauen können. Kunden werden uns nicht vertrauen, wenn größere Häuser manchmal billiger aussehen. Wir brauchen eine Garantie. Das ist ein Monotonizitätsproblem. ““

Und so lernt Alan seine nächste große ML -Lektion: Metriken sind nicht alles.

Was ist die Monotonizität in ML?

Aida erklärt:

„Monotonizität bedeutet, dass sich Vorhersagen in konsistenter Richtung bewegen, wenn sich die Eingänge ändern. Es ist, als würde man das Modell sagen: Wenn die Quadratmeter steigt, sollte der Preis niemals sinken. Wir nennen es Monoton zunehmen. Oder als ein weiteres Beispiel, wenn ein Hausalter älter wird, sollten die vorhergesagten Preise nicht steigen. Wir nennen das Monoton abnehmen. ““

Alan kommt zu dem Schluss::

„So ist die Monotonizität hier wichtig, weil es:

Übereinstimmen mit GeschäftslogikUnd
Verbessert Vertrauen und Interpretierbarkeit. ““

Aida nickte:

„Ja, und es hilft, sich zu treffen Equity & regulatorische Erwartungen. ““

Visualisieren des Issues

AIDA erstellt in Pandas einen Spielzeugdatensatz, um das Downside zu zeigen:

import pandas as pd

# Instance toy dataset
information = pd.DataFrame({
   "sqft": (1200, 1500, 1800, 2000, 2200, 2250),
   "predicted_price": (250000, 270000, 260000, 280000, 290000, 285000)  # Discover dip at 1800 sqft and 2250 sqft
})

# Kind by sqft
data_sorted = information.sort_values("sqft")

# Verify variations in goal
data_sorted("price_diff") = data_sorted("predicted_price").diff()

# Discover monotonicity violations (the place value decreases as sqft will increase)
violations = data_sorted(data_sorted("price_diff") < 0)
print("Monotonicity violations:n", violations)

Monotonicity violations:
    sqft   value  price_diff
2  1800  260000    -10000.0
5  2250  285000     -5000.0

Und dann plant sie die Verstöße:

import matplotlib.pyplot as plt
plt.determine(figsize=(7,5))
plt.plot(information("sqft"), information("predicted_price"), marker="o", linestyle="-.", colour="steelblue", label="Predicted Worth")


# Spotlight the dips
for sqft, value, price_diff in violations.values:
 plt.scatter(sqft, value, colour="crimson", zorder=5)
 plt.textual content(x=sqft, y=price-3000, s="Dip!", colour="crimson", ha="heart")


# Labels and title
plt.title("Predicted Home Costs vs. Sq. Footage")
plt.xlabel("Sq. Footage (sqft)")
plt.ylabel("Predicted Worth ($)")
plt.grid(True, linestyle="--", alpha=0.6)
plt.legend()

Aida zeigt auf die Dips: „Hier ist das Downside: 1.800 m² kostet weniger als 1.500 m² groß und 2.250 m² groß als 2.200 m².”

Beheben Sie es mit Monotonizitätsbeschränkungen in Xgboost

Alan stellt das Modell ab und setzt a monotonische zunehmende Einschränkungen An Quadratmeterzahl Und monotonische abnehmende Einschränkung An Hausalter.
Dies zwingt das Modell immer

erhöhen (oder bleiben gleich), wenn Quadratmeterzahl Angesichts aller anderen Merkmale werden erhöht.
Verringern Sie (oder bleiben Sie gleich), wenn das Alter des Hauses zunimmt, da alle anderen Merkmale festgelegt sind.

Er verwendet XGBOOST, um die Monotonie leicht durchzusetzen:

import xgboost as xgb
from sklearn.model_selection import train_test_split

df = pd.DataFrame({
   "sqft": (1200, 1500, 1800, 2000, 2200),
   "house_age": (30, 20, 15, 10, 5),
   "value": (250000, 270000, 280000, 320000, 350000)
})

X = df(("sqft", "house_age"))
y = df("value")

X_train, X_test, y_train, y_test = train_test_split(X, y, 
                                    test_size=0.2, random_state=42)

monotone_constraints = {
   "sqft": 1,        # Monotone rising
   "house_age": -1   # Monotone reducing
}

mannequin = xgb.XGBRegressor(
   monotone_constraints=monotone_constraints,
   n_estimators=200,
   learning_rate=0.1,
   max_depth=4,
   random_state=42
)

mannequin.match(X_train, y_train)

print(X_test)
print("Predicted value:", mannequin.predict(X_test.values))

  sqft  house_age
1  1500         20
Predicted value: (250000.84)

Alan übergibt das neue Modell AIDA. „Jetzt respektiert das Modell Domänenwissen. Vorhersagen für größere Häuser wird niemals unten sinken kleinere. „

AIDA testet das Modell erneut:

1500 m² → 300.000 USD
2000 m² → 350.000 US -Greenback
2500 m² → 400.000 $

Jetzt sieht sie ein glatteres Grundstück der Immobilienpreise gegenüber Quadratmeter.

import matplotlib.pyplot as plt

data2 = pd.DataFrame({
  "sqft": (1200, 1500, 1800, 2000, 2200, 2250),
  "predicted_price": (250000, 270000, 275000, 280000, 290000, 292000)
})

plt.determine(figsize=(7,5))
plt.plot(data2("sqft"), data2("predicted_price"), marker="o", 
                     linestyle="-.", colour="inexperienced", label="Predicted Worth")

plt.title("Monotonic Predicted Home Costs vs. Sq. Footage")
plt.xlabel("Sq. Footage (sqft)")
plt.ylabel("Predicted Worth ($)")
plt.grid(True, linestyle="--", alpha=0.6)
plt.legend()

Aida: „Perfekt! Wenn Häuser gleich alt sind, führt eine größere Größe durchweg zu einem höheren oder gleichen Preis. Umgekehrt werden Häuser derselben Quadratmeterzahl immer günstiger, wenn sie älter sind.“

Alan: „Ja – wir haben das Modell gegeben Leitplanken Das übereinstimmt mit Domänenwissen. “

Beispiele für reale Welt

Alan: Welche anderen Domänen können von Einschränkungen der Monotonie profitieren?

Aida: Überall Kunden oder Geld sind involviert, Monotonizität kann sich auf das Vertrauen auswirken. Einige Domänen, in denen die Monotonizität wirklich wichtig ist:

Hauspreise → Größere Häuser sollten nicht günstiger sein.
Kreditgenehmigungen → höheres Einkommen sollte die Genehmigungswahrscheinlichkeit nicht verringern.
Kreditbewertung → Eine längere Rückzahlungsgeschichte sollte die Punktzahl nicht senken.
Kundenlebensdauerwert (CLV) → Weitere Einkäufe sollten die CLV -Vorhersagen nicht senken.
Versicherungspreise → Mehr Abdeckung sollte die Prämie nicht verringern.

Imbiss

Genauigkeit allein garantiert nicht Vertrauenswürdigkeit.
Monotonizität sorgt dafür, dass Vorhersagen mit der Übereinstimmung mit gesunde Menschenverstand und Geschäftsregeln.
Kunden, Aufsichtsbehörden und Stakeholder akzeptieren und verwenden eher Modelle, die beide sind Genau und logisch.

Wie Aida Alan erinnert:

„Machen Sie Modelle nicht nur klug, sondern auch vernünftig.“

Gedanken schließen

Wenn Sie das nächste Mal ein Modell erstellen, fragen Sie nicht nur: Wie genau ist es? Fragen Sie auch: Ist es für die Menschen, die es benutzen, Sinn?

Monotonizitätsbeschränkungen sind eines von vielen Werkzeugen für Entwerfen vertrauenswürdiger ML -Modelle – neben Erklärung, Equity -Einschränkungen und Transparenz.

. . .

Danke fürs Lesen! Ich teile oft Erkenntnisse über praktische KI/ML -Techniken – Let’s Join on LinkedIn Wenn Sie das Gespräch fortsetzen möchten.

Entwerfen vertrauenswürdiger ML -Modelle: Alan & Aida Entdecken Sie die Monotonizität im maschinellen Lernen

Die Geschichte: Alan & Aidas Entdeckung

Was ist die Monotonizität in ML?

Visualisieren des Issues

Beheben Sie es mit Monotonizitätsbeschränkungen in Xgboost

Beispiele für reale Welt

Imbiss

Gedanken schließen

Von admin

Schreibe einen Kommentar Antworten abbrechen

Versäumt

Warum Shaip sich für Airtm entschieden hat: Schnellere, gerechtere globale Zahlungen für Mitwirkende

Das KI-Modell, das sich sofort anfühlt

Wie Web3 digitale Fangemeinschaften im globalen Sport neu gestaltet

Docker AI für Agent Builder: Modelle, Instruments und Cloud-Offload

About

Categories

Tags

Recent Post

Warum Shaip sich für Airtm entschieden hat: Schnellere, gerechtere globale Zahlungen für Mitwirkende

Das KI-Modell, das sich sofort anfühlt

Die Geschichte: Alan & Aidas Entdeckung

Was ist die Monotonizität in ML?

Visualisieren des Issues

Beheben Sie es mit Monotonizitätsbeschränkungen in Xgboost

Beispiele für reale Welt

Imbiss

Gedanken schließen

Von admin

Ähnlicher Beitrag

Schreibe einen Kommentar Antworten abbrechen

Versäumt