portaldacalheta.pt
  • Κύριος
  • Επιστήμη Δεδομένων Και Βάσεις Δεδομένων
  • Κατανεμημένες Ομάδες
  • Ευκίνητο Ταλέντο
  • Κερδοφορία & Αποδοτικότητα
Πίσω Μέρος

Μηχανές και εμπιστοσύνη: Πώς να μετριαστεί η προκατάληψη της AI



Το 2016, το Παγκόσμιο Οικονομικό Φόρουμ ισχυρίστηκε ότι βιώνουμε το τέταρτο κύμα της Βιομηχανικής Επανάστασης: αυτοματοποίηση που χρησιμοποιεί κυβερνο-φυσικά συστήματα. Τα βασικά στοιχεία αυτού του κύματος περιλαμβάνουν τη νοημοσύνη μηχανών, την αποκεντρωμένη διακυβέρνηση που βασίζεται σε blockchain και την επεξεργασία γονιδιώματος. Όπως συνέβη με τα προηγούμενα κύματα, αυτές οι τεχνολογίες μειώνουν την ανάγκη για ανθρώπινη εργασία, αλλά θέτουν νέες ηθικές προκλήσεις, ειδικά για εταιρείες ανάπτυξης τεχνητής νοημοσύνης και τους πελάτες τους.

utf πίνακα σετ 8 χαρακτήρων

Ο σκοπός αυτού του άρθρου είναι να αναθεωρήσει τις πρόσφατες ιδέες για τον εντοπισμό και τον μετριασμό της ανεπιθύμητης προκατάληψης στα μοντέλα μηχανικής μάθησης. Θα συζητήσουμε πρόσφατα δημιουργημένες οδηγίες σχετικά με την αξιόπιστη τεχνητή νοημοσύνη, θα εξετάσουμε παραδείγματα προκατάληψης τεχνητής νοημοσύνης που προκύπτουν τόσο από την επιλογή μοντέλου όσο και από την υποκείμενη κοινωνική μεροληψία, θα προτείνουμε επιχειρηματικές και τεχνικές πρακτικές για τον εντοπισμό και τον μετριασμό της προκατειλημμένης τεχνητής νοημοσύνης και θα συζητήσουμε τις νομικές υποχρεώσεις που υπάρχουν επί του παρόντος στο πλαίσιο του GDPR και όπου μπορεί να αναπτυχθούν στο μέλλον.



Άνθρωποι: Η απόλυτη πηγή προκατάληψης στη μηχανική μάθηση

Όλα τα μοντέλα είναι κατασκευασμένα από ανθρώπους και αντανακλούν ανθρώπινες προκαταλήψεις. Τα μοντέλα μηχανικής μάθησης μπορούν να αντικατοπτρίζουν τις προκαταλήψεις των οργανωτικών ομάδων, των σχεδιαστών σε αυτές τις ομάδες, των επιστημόνων δεδομένων που εφαρμόζουν τα μοντέλα και των μηχανικών δεδομένων που συλλέγουν δεδομένα. Φυσικά, αντικατοπτρίζουν επίσης την προκατάληψη που υπάρχει στα ίδια τα δεδομένα. Ακριβώς όπως αναμένουμε ένα επίπεδο αξιοπιστίας από τους υπεύθυνους λήψης αποφάσεων, πρέπει να περιμένουμε και να παραδώσουμε ένα επίπεδο αξιοπιστίας από τα μοντέλα μας.



Ένα αξιόπιστο μοντέλο θα εξακολουθεί να περιέχει πολλές προκαταλήψεις επειδή η προκατάληψη (με την ευρύτερη έννοια) είναι η ραχοκοκαλιά της μηχανικής μάθησης. Ένα μοντέλο πρόβλεψης καρκίνου του μαστού θα προβλέψει σωστά ότι οι ασθενείς με ιστορικό καρκίνου του μαστού είναι προκατειλημμένοι προς ένα θετικό αποτέλεσμα. Ανάλογα με το σχεδιασμό, μπορεί να μάθει ότι οι γυναίκες είναι προκατειλημμένες προς ένα θετικό αποτέλεσμα. Το τελικό μοντέλο μπορεί να έχει διαφορετικά επίπεδα ακρίβειας για γυναίκες και άνδρες και να είναι μεροληπτικό με αυτόν τον τρόπο. Η βασική ερώτηση που πρέπει να κάνετε δεν είναι Είναι το μοντέλο μου προκατειλημμένο; , γιατί η απάντηση θα είναι πάντα Ναί .



Αναζητώντας καλύτερες ερωτήσεις, η ομάδα εμπειρογνωμόνων υψηλού επιπέδου της Ευρωπαϊκής Ένωσης για την Τεχνητή Νοημοσύνη έχει εκπονήσει κατευθυντήριες γραμμές που ισχύουν για την κατασκευή μοντέλων. Γενικά, μοντέλα μηχανικής μάθησης πρέπει να είναι :

  1. Νόμιμο - σεβόμενος όλους τους ισχύοντες νόμους και κανονισμούς
  2. Ηθικά - σεβόμενοι τις ηθικές αρχές και αξίες
  3. Ανθεκτικό - και από τεχνική άποψη, λαμβάνοντας υπόψη το κοινωνικό του περιβάλλον

Αυτές οι σύντομες απαιτήσεις, και τη μεγαλύτερη μορφή τους , συμπεριλάβετε και υπερβαίνετε ζητήματα προκατάληψης, ενεργώντας ως λίστα ελέγχου για μηχανικούς και ομάδες. Μπορούμε να αναπτύξουμε πιο αξιόπιστα συστήματα τεχνητής νοημοσύνης εξετάζοντας αυτές τις προκαταλήψεις στα μοντέλα μας που θα μπορούσαν να είναι παράνομες, ανήθικες ή ανθεκτικές, στο πλαίσιο της δήλωσης προβλημάτων και του τομέα.



Ιστορικές περιπτώσεις της προκατάληψης AI

Ακολουθούν τρία ιστορικά μοντέλα με αμφίβολη αξιοπιστία, λόγω της προκατάληψης της AI που είναι παράνομη, ανήθικη ή ανθεκτική. Η πρώτη και πιο διάσημη θήκη, το μοντέλο COMPAS, δείχνει πώς ακόμη και τα πιο απλά μοντέλα μπορούν να κάνουν διακρίσεις ανήθικα ανάλογα με τη φυλή. Η δεύτερη περίπτωση δείχνει ένα ελάττωμα στα περισσότερα μοντέλα επεξεργασίας φυσικής γλώσσας (NLP): Δεν είναι ισχυρά σε φυλετικές, σεξουαλικές και άλλες προκαταλήψεις. Η τελική περίπτωση, το Allegheny Family Screening Tool, δείχνει ένα παράδειγμα ενός μοντέλου βασικά ελαττωματικό από προκατειλημμένα δεδομένα και μερικές βέλτιστες πρακτικές για τον περιορισμό αυτών των ελαττωμάτων.

ΠΥΞΙΔΑ

Το κανονικό παράδειγμα της προκατειλημμένης, αναξιόπιστης τεχνητής νοημοσύνης είναι το σύστημα COMPAS, που χρησιμοποιείται στη Φλόριντα και σε άλλες πολιτείες των ΗΠΑ. Το σύστημα COMPAS χρησιμοποίησε ένα μοντέλο παλινδρόμησης για να προβλέψει εάν ο δράστης ήταν πιθανό να υποχωρήσει ή όχι. Αν και βελτιστοποιήθηκε για συνολική ακρίβεια, το μοντέλο προέβλεπε διπλάσιο αριθμό ψευδών θετικών για υποτροπή για τις αφροαμερικάνικες εθνικότητες από ό, τι για τις καυκάσιες εθνότητες.



Το παράδειγμα COMPAS δείχνει πόσο ανεπιθύμητη προκατάληψη μπορεί να εισχωρήσει στα μοντέλα μας, ανεξάρτητα από το πόσο άνετη είναι η μεθοδολογία μας. Από τεχνικής άποψης, η προσέγγιση των δεδομένων COMPAS ήταν εξαιρετικά συνηθισμένη, παρόλο που τα δεδομένα της έρευνας περιείχαν ερωτήσεις με αμφισβητήσιμη σημασία. Ένα μικρό εποπτευόμενο μοντέλο εκπαιδεύτηκε σε ένα σύνολο δεδομένων με μικρό αριθμό χαρακτηριστικών. (Στην πρακτική μου, έχω ακολουθήσει μια παρόμοια τεχνική διαδικασία δεκάδες φορές, όπως πιθανότατα ισχύει για οποιονδήποτε επιστήμονα δεδομένων ή μηχανικό ML.) Ωστόσο, οι συνήθεις επιλογές σχεδιασμού παρήγαγαν ένα μοντέλο που περιείχε ανεπιθύμητη, φυλετική διάκριση.

Το μεγαλύτερο ζήτημα στο την υπόθεση COMPAS δεν ήταν με την απλή επιλογή μοντέλου, ή ακόμη και ότι τα δεδομένα ήταν ελαττωματικά. Αντίθετα, η ομάδα COMPAS απέτυχε να θεωρήσει ότι ο τομέας (καταδίκη), η ερώτηση (ανίχνευση υποτροπής) και οι απαντήσεις (βαθμολογίες υποτροπής) είναι γνωστό ότι περιλαμβάνουν ανισότητες σε φυλετικούς, σεξουαλικούς και άλλους άξονες ακόμη και όταν δεν εμπλέκονται αλγόριθμοι. Αν η ομάδα έψαχνε μεροληψία, θα το είχαν βρει. Με αυτήν την επίγνωση, η ομάδα COMPAS μπορεί να ήταν σε θέση να δοκιμάσει διαφορετικές προσεγγίσεις και να αναδημιουργήσει το μοντέλο ενώ προσαρμόστηκε για προκατάληψη. Αυτό θα λειτουργούσε στη συνέχεια για να μειώσει την άδικη φυλάκιση των Αφροαμερικανών, αντί να την επιδεινώσει.



Οποιοδήποτε μοντέλο NLP προ-εκπαιδευμένο Naïvely στο Common Crawl, Google News ή οποιοδήποτε άλλο Corpus, από το Word2Vec

Μεγάλα, προ-εκπαιδευμένα μοντέλα αποτελούν τη βάση για τις περισσότερες εργασίες NLP. Εκτός εάν αυτά τα βασικά μοντέλα έχουν σχεδιαστεί ειδικά για να αποφεύγουν τη μεροληψία κατά μήκος ενός συγκεκριμένου άξονα, Είναι βέβαιο ότι θα διαποτιστούν με τις εγγενείς προκαταλήψεις της εταιρείας με την οποία εκπαιδεύονται - για τον ίδιο λόγο ότι αυτά τα μοντέλα λειτουργούν καθόλου. Τα αποτελέσματα αυτής της προκατάληψης, σύμφωνα με φυλετικές και φυλετικές γραμμές, έχουν εμφανιστεί σε μοντέλα Word2Vec και GloVe εκπαιδεύτηκε στο Common Crawl και στις Ειδήσεις Google αντίστοιχα. Ενώ τα μοντέλα με βάση τα συμφραζόμενα, όπως το BERT, είναι τα τρέχοντα state-of-the-art (αντί για τα Word2Vec και GloVe), δεν υπάρχουν ενδείξεις ότι η εταιρεία στα οποία εκπαιδεύονται αυτά τα μοντέλα είναι λιγότερο διακριτική.

Παρόλο που οι καλύτερες αρχιτεκτονικές μοντέλων για οποιοδήποτε πρόβλημα NLP διαποτίζονται με διακριτικό κλίμα, η λύση δεν είναι να εγκαταλείψουμε τα προκαθορισμένα μοντέλα, αλλά μάλλον να εξετάσουμε τον συγκεκριμένο τομέα, τη δήλωση προβλήματος και τα δεδομένα στο σύνολό τους με την ομάδα. Εάν μια εφαρμογή είναι εκείνη που είναι γνωστό ότι διαδραματίζει διακριτική προκατάληψη από τους ανθρώπους, οι προγραμματιστές θα πρέπει να γνωρίζουν ότι τα μοντέλα είναι πιθανό να διαιωνίσουν αυτήν τη διάκριση.



Allegheny Family Screening Tool: Αθέμιτα προκατειλημμένο, αλλά καλά σχεδιασμένο και μετριασμένο

Σε αυτό το τελικό παράδειγμα, συζητάμε ένα μοντέλο που δημιουργήθηκε από δεδομένα αθέμιτων διακρίσεων, αλλά η ανεπιθύμητη προκατάληψη μετριάζεται με διάφορους τρόπους. Το Allegheny Family Screening Tool είναι ένα μοντέλο που έχει σχεδιαστεί για να βοηθά τους ανθρώπους να αποφασίζουν εάν ένα παιδί πρέπει να απομακρυνθεί από την οικογένειά του λόγω καταχρηστικών περιστάσεων. Το εργαλείο σχεδιάστηκε ανοιχτά και με διαφάνεια με δημόσια φόρουμ και ευκαιρίες εύρεσης ελαττωμάτων και ανισοτήτων στο λογισμικό.

Η ανεπιθύμητη προκατάληψη στο μοντέλο προέρχεται από ένα δημόσιο σύνολο δεδομένων που αντικατοπτρίζει ευρύτερες κοινωνικές προκαταλήψεις. Οι οικογένειες μεσαίας και ανώτερης κατηγορίας έχουν μεγαλύτερη ικανότητα να «κρύβουν» κακοποίηση χρησιμοποιώντας ιδιωτικούς παρόχους υγείας. Οι παραπομπές στην κομητεία Allegheny πραγματοποιούνται τρεις φορές συχνότερα για οικογένειες αφροαμερικάνων και biracial από τις λευκές οικογένειες. Οι σχολιαστές αρέσουν Βιρτζίνια Eubanks και Έλεν Μπρόντ ισχυρίστηκαν ότι ζητήματα δεδομένων όπως αυτά μπορούν να επιλυθούν μόνο εάν η κοινωνία είναι σταθερή, έργο πέρα ​​από οποιονδήποτε μεμονωμένο μηχανικό.



Στην παραγωγή, ο νομός καταπολεμά τις ανισότητες στο μοντέλο του χρησιμοποιώντας το μόνο ως συμβουλευτικό εργαλείο για τους πρώτους εργαζόμενους και σχεδιάζει εκπαιδευτικά προγράμματα έτσι ώστε οι πρώτοι εργαζόμενοι να γνωρίζουν τις αποτυχίες του συμβουλευτικού μοντέλου όταν λαμβάνουν τις αποφάσεις τους. Με τις νέες εξελίξεις στους αλγόριθμους debiasing, το Allegheny County έχει νέες ευκαιρίες για τον μετριασμό της λανθάνουσας προκατάληψης στο μοντέλο.

Η ανάπτυξη του εργαλείου Allegheny έχει πολλά να διδάξει στους μηχανικούς τα όρια των αλγορίθμων για να ξεπεράσουν τις λανθάνουσες διακρίσεις στα δεδομένα και τις κοινωνικές διακρίσεις που διέπουν αυτά τα δεδομένα. Παρέχει στους μηχανικούς και τους σχεδιαστές ένα παράδειγμα συμβουλευτικής δημιουργίας μοντέλων που μπορεί να μετριάσει τον πραγματικό αντίκτυπο της πιθανής μεροληπτικής διάκρισης σε ένα μοντέλο.

Αποφυγή και μετριασμός της προκατάληψης AI: Βασική επιχειρηματική ευαισθητοποίηση

Ευτυχώς, υπάρχουν ορισμένες προσεγγίσεις και μέθοδοι που προκαλούν εξουθενώσεις - πολλές από τις οποίες χρησιμοποιούν το σύνολο δεδομένων COMPAS ως σημείο αναφοράς.

Βελτιώστε την ποικιλομορφία, μετριάστε τα ελλείμματα ποικιλομορφίας

Η διατήρηση διαφορετικών ομάδων, τόσο από άποψη δημογραφικών στοιχείων όσο και από άποψη δεξιοτήτων, είναι σημαντική για την αποφυγή και τον μετριασμό της ανεπιθύμητης προκατάληψης AI. Παρά τη συνεχή εξυπηρέτηση των χειριστών που καταβάλλεται στη διαφορετικότητα από στελέχη τεχνολογίας, γυναίκες και άνθρωποι του χρώματος παραμένουν υποεκπροσωπούνται.

Διάφορα μοντέλα ML έχουν χαμηλότερη απόδοση στις στατιστικές μειονότητες εντός της ίδιας της βιομηχανίας AI και οι άνθρωποι που παρατηρούν πρώτα αυτά τα ζητήματα είναι χρήστες που είναι γυναίκες και / ή έγχρωμοι. Με περισσότερη ποικιλομορφία στις ομάδες AI, τα θέματα γύρω από ανεπιθύμητες προκαταλήψεις μπορούν να παρατηρηθούν και να μετριαστούν πριν κυκλοφορήσουν στην παραγωγή.

Να προσέχετε τους διακομιστές μεσολάβησης: Η κατάργηση ετικετών προστατευμένης κλάσης από ένα μοντέλο ενδέχεται να μην λειτουργεί!

Μια κοινή, αφελής προσέγγιση για την αφαίρεση προκατάληψης που σχετίζεται με προστατευμένες τάξεις (όπως σεξ ή φυλή) από δεδομένα είναι η διαγραφή των ετικετών που σηματοδοτούν φυλή ή σεξ από τα μοντέλα. Σε πολλές περιπτώσεις, αυτό δεν θα λειτουργήσει, επειδή το μοντέλο μπορεί να δημιουργήσει κατανόηση αυτών των προστατευμένων τάξεων από άλλες ετικέτες, όπως ταχυδρομικούς κώδικες. Η συνήθης πρακτική περιλαμβάνει την αφαίρεση αυτών των ετικετών επίσης, τόσο για τη βελτίωση των αποτελεσμάτων των μοντέλων στην παραγωγή, αλλά και λόγω νομικών απαιτήσεων. Η πρόσφατη ανάπτυξη αλγορίθμων αποσυμπίεσης, την οποία θα συζητήσουμε παρακάτω, αντιπροσωπεύει έναν τρόπο μετριασμού της προκατάληψης AI χωρίς αφαίρεση ετικετών.

Να γνωρίζετε τους τεχνικούς περιορισμούς

Ακόμη και οι βέλτιστες πρακτικές στο σχεδιασμό προϊόντων και στη δημιουργία μοντέλων δεν θα είναι αρκετές για την εξάλειψη των κινδύνων ανεπιθύμητης προκατάληψης, ιδιαίτερα σε περιπτώσεις προκατειλημμένων δεδομένων. Είναι σημαντικό να αναγνωρίσουμε τους περιορισμούς των δεδομένων, των μοντέλων και των τεχνικών μας λύσεων στην προκατάληψη, τόσο για λόγους ευαισθητοποίησης, όσο και για τις ανθρώπινες μεθόδους περιορισμού της προκατάληψης μηχανική εκμάθηση όπως το human-in-the-loop μπορεί να εξεταστεί.

Αποφυγή και μετριασμός της προκατάληψης της τεχνητής νοημοσύνης: Βασικά τεχνικά εργαλεία για ευαισθητοποίηση και εξουδετέρωση

Οι επιστήμονες των δεδομένων διαθέτουν όλο και περισσότερα εργαλεία τεχνικής ευαισθητοποίησης και αδυναμίας, τα οποία συμπληρώνουν την ικανότητα μιας ομάδας να αποφεύγει και να μετριάζει την προκατάληψη AI. Επί του παρόντος, τα εργαλεία ευαισθητοποίησης είναι πιο εξελιγμένα και καλύπτουν ένα ευρύ φάσμα επιλογών μοντέλου και μέτρων μεροληψίας, ενώ τα εργαλεία αποσυμπίεσης είναι γενικά και μπορούν να μετριάσουν την προκατάληψη σε μοντέλα μόνο σε συγκεκριμένες περιπτώσεις.

Εργαλεία ευαισθητοποίησης και εξομάλυνσης για αλγόριθμους εποπτευόμενης μάθησης

Η IBM κυκλοφόρησε μια σειρά εργαλείων ευαισθητοποίησης και εξουδετέρωσης για δυαδικούς ταξινομητές στην ενότητα Δικαιοσύνη έργο. Για τον εντοπισμό της προκατάληψης του AI και τον μετριασμό της, όλες οι μέθοδοι απαιτούν μια ετικέτα τάξης (π.χ. φυλή, σεξουαλικός προσανατολισμός). Σε σχέση με αυτήν την ετικέτα τάξης, μπορεί να εκτελεστεί μια σειρά μετρήσεων (π.χ. διαφορετική επίδραση και διαφορά ίσων ευκαιριών) που ποσοτικοποιούν την προκατάληψη του μοντέλου προς συγκεκριμένα μέλη της τάξης. Περιλαμβάνουμε μια εξήγηση αυτών των μετρήσεων στο κάτω μέρος του άρθρου.

Μόλις εντοπιστεί προκατάληψη, η βιβλιοθήκη AI Fairness 360 (AIF360) έχει 10 προσεγγίσεις (και καταμέτρηση) που μπορούν να εφαρμοστούν σε μοντέλα που κυμαίνονται από απλούς ταξινομητές έως βαθιά νευρωνικά δίκτυα. Μερικοί είναι αλγόριθμοι προεπεξεργασίας, που στοχεύουν στην εξισορρόπηση των ίδιων των δεδομένων. Άλλοι είναι αλγόριθμοι σε επεξεργασία που τιμωρούν την ανεπιθύμητη προκατάληψη κατά την κατασκευή του μοντέλου. Ωστόσο, άλλοι εφαρμόζουν βήματα μετά την επεξεργασία για να εξισορροπήσουν τα ευνοϊκά αποτελέσματα μετά από μια πρόβλεψη. Η συγκεκριμένη καλύτερη επιλογή θα εξαρτηθεί από το πρόβλημά σας.

Το AIF360 έχει σημαντικό πρακτικό περιορισμό στο ότι οι αλγόριθμοι ανίχνευσης και μετριασμού μεροληψίας έχουν σχεδιαστεί για δυαδικά προβλήματα ταξινόμησης, και πρέπει να επεκταθούν σε προβλήματα πολυκλάσης και παλινδρόμησης. Άλλες βιβλιοθήκες, όπως μετοχικό κεφάλαιο και LIME, έχουν καλές μετρήσεις για μερικά πιο περίπλοκα μοντέλα - αλλά εντοπίζουν μόνο προκατάληψη. Δεν είναι σε θέση να το διορθώσουν. Αλλά ακόμη και η γνώση ότι ένα μοντέλο είναι προκατειλημμένο πριν ξεκινήσει η παραγωγή του είναι ακόμα πολύ χρήσιμη, καθώς θα πρέπει να οδηγήσει στη δοκιμή εναλλακτικών προσεγγίσεων πριν από την κυκλοφορία.

Εργαλείο γενικής ευαισθητοποίησης: LIME

Η εργαλειοθήκη τοπικών ερμηνεύσιμων μοντέλων-αγνωστικών επεξηγήσεων (LIME) μπορεί να χρησιμοποιηθεί για τη μέτρηση της σπουδαιότητας των χαρακτηριστικών και για την εξήγηση της τοπικής συμπεριφοράς των περισσότερων μοντέλων - ταξινόμηση πολλαπλών κλάσεων, παλινδρόμηση και εφαρμογές βαθιάς μάθησης που περιλαμβάνονται. Η γενική ιδέα είναι να ταιριάξει ένα πολύ ερμηνεύσιμο γραμμικό ή δέντρο δέντρο μοντέλο στις προβλέψεις του μοντέλου που δοκιμάζεται για προκατάληψη.

Για παράδειγμα, τα βαθιά CNN για την αναγνώριση εικόνας είναι πολύ ισχυρά αλλά δεν είναι πολύ ερμηνεύσιμα. Εκπαιδεύοντας ένα γραμμικό μοντέλο για να μιμηθούμε τη συμπεριφορά του δικτύου, μπορούμε να αποκτήσουμε κάποια εικόνα για το πώς λειτουργεί. Προαιρετικά, οι υπεύθυνοι λήψης αποφάσεων μπορούν να επανεξετάσουν τους λόγους πίσω από την απόφαση του μοντέλου σε συγκεκριμένες περιπτώσεις μέσω του LIME και να λάβουν τελική απόφαση. Αυτή η διαδικασία σε ιατρικό πλαίσιο παρουσιάζεται με την παρακάτω εικόνα.

δείγμα εγγράφου σχεδιασμού υψηλού επιπέδου

Εξηγώντας μεμονωμένες προβλέψεις σε έναν άνθρωπο που λαμβάνει αποφάσεις. Το μοντέλο προβλέπει ότι ένας ασθενής έχει τη γρίπη με βάση τα συμπτώματα ή την έλλειψή τους. Ο εξηγητής, LIME, αποκαλύπτει στον γιατρό τη στάθμιση πίσω από κάθε σύμπτωμα και πώς ταιριάζει στα δεδομένα. Ο γιατρός παίρνει ακόμα την τελική απόφαση, αλλά είναι καλύτερα ενημερωμένος για το μοντέλο

Μοντέλα NLP

Νωρίτερα, συζητήσαμε τις λανθάνουσες προκαταλήψεις στις περισσότερες εταιρείες που χρησιμοποιήθηκαν για την εκπαίδευση μοντέλων NLP. Εάν είναι πιθανό να υπάρχει ανεπιθύμητη προκατάληψη για ένα δεδομένο πρόβλημα, προτείνω εύκολα διαθέσιμες ενσωματωμένες λέξεις . Κρίνοντας από το ενδιαφέρον της ακαδημαϊκής κοινότητας, είναι πιθανό ότι τα νεότερα μοντέλα NLP αρέσουν BERT σύντομα θα έχει ενσωματωμένες ενσωματώσεις λέξεων.

Διόρθωση συνομιλιακών νευρωνικών δικτύων (CNN)

Παρόλο που το LIME μπορεί να εξηγήσει τη σημασία των μεμονωμένων χαρακτηριστικών και να παρέχει τοπικές εξηγήσεις συμπεριφοράς σε συγκεκριμένες εισόδους εικόνας, το LIME δεν εξηγεί τη συνολική συμπεριφορά ενός CNN ούτε επιτρέπει στους επιστήμονες δεδομένων να αναζητήσουν ανεπιθύμητη προκατάληψη.

Σε διάσημες περιπτώσεις όπου βρέθηκε ανεπιθύμητη προκατάληψη του CNN, μέλη του κοινού (όπως Χαρά Buolamwini ) παρατήρησαν περιπτώσεις προκατάληψης βάσει της συμμετοχής τους σε μια μειονεκτική ομάδα. Ως εκ τούτου, οι καλύτερες προσεγγίσεις για τον μετριασμό συνδυάζουν τεχνικές και επιχειρηματικές προσεγγίσεις: Δοκιμάστε συχνά και δημιουργήστε διαφορετικές ομάδες που μπορούν να βρουν ανεπιθύμητη προκατάληψη AI μέσω δοκιμών πριν από την παραγωγή.

Νομικές υποχρεώσεις και μελλοντικές κατευθύνσεις γύρω από την Ηθική AI

Σε αυτήν την ενότητα, εστιάζουμε στον Γενικό Κανονισμό Προστασίας Δεδομένων της Ευρωπαϊκής Ένωσης (GDPR). Ο GDPR είναι παγκοσμίως το de facto πρότυπο στη νομοθεσία περί προστασίας δεδομένων. (Αλλά δεν είναι η μόνη νομοθεσία - υπάρχει επίσης η Προδιαγραφή Ασφάλειας Προσωπικών Πληροφοριών της Κίνας, για παράδειγμα.) Το εύρος και η έννοια του GDPR είναι πολύ συζητήσιμα, επομένως δεν προσφέρουμε καμία νομική συμβουλή σε αυτό το άρθρο. Παρ 'όλα αυτά, λέγεται ότι είναι προς το συμφέρον των οργανισμών παγκοσμίως να συμμορφωθούν, ως ισχύει ο GDPR όχι μόνο σε ευρωπαϊκούς οργανισμούς αλλά και σε οργανισμούς που χειρίζονται δεδομένα που ανήκουν σε ευρωπαίους πολίτες ή κατοίκους.

Ο GDPR διαχωρίζεται σε δέσμευση άρθρα και μη δεσμευτική Ρεσιτάλ . Ενώ τα άρθρα επιβαρύνουν ορισμένους μηχανικούς και οργανισμούς που χρησιμοποιούν προσωπικά δεδομένα, οι πιο αυστηρές διατάξεις για τον μετριασμό των προκαταλήψεων βρίσκονται στην αιτιολογική σκέψη 71 και δεν είναι δεσμευτικές. Η αιτιολογική σκέψη 71 συγκαταλέγεται μεταξύ των πιο πιθανών μελλοντικών κανονισμών, όπως έχει ήδη μελετηθεί από τους νομοθέτες. Σχόλια εξερευνώ Υποχρεώσεις GDPR με περισσότερες λεπτομέρειες.

επιχειρηματική νοημοσύνη και τεχνητή νοημοσύνη

Θα μεγεθύνουμε δύο βασικές απαιτήσεις και τι σημαίνουν για τους κατασκευαστές μοντέλων.

1. Πρόληψη διακρίσεων

Ο GDPR επιβάλλει απαιτήσεις στις τεχνικές προσεγγίσεις για οποιαδήποτε μοντελοποίηση προσωπικών δεδομένων. Οι επιστήμονες δεδομένων που εργάζονται με ευαίσθητα προσωπικά δεδομένα θα θέλουν να διαβάσουν το κείμενο του άρθρου 9, το οποίο απαγορεύει πολλές χρήσεις ιδιαίτερα ευαίσθητων προσωπικών δεδομένων (όπως φυλετικά αναγνωριστικά). Γενικές απαιτήσεις μπορείτε να βρείτε στην αιτιολογική σκέψη 71:

[. . .] χρήση κατάλληλες μαθηματικές ή στατιστικές διαδικασίες , [. . .] βεβαιωθείτε ότι το ελαχιστοποιείται ο κίνδυνος σφαλμάτων [. . .], και αποτρέπουν τις διακρίσεις με βάση τη φυλετική ή εθνοτική καταγωγή, την πολιτική γνώμη, τη θρησκεία ή τις πεποιθήσεις, τη συμμετοχή σε συνδικαλιστική οργάνωση, τη γενετική ή την υγεία κατάσταση ή τον σεξουαλικό προσανατολισμό.

GDPR (δική μου έμφαση)

Μεγάλο μέρος αυτής της αιτιολογικής σκέψης είναι αποδεκτό ως θεμελιώδες για την καλή δημιουργία μοντέλου: Η μείωση του κινδύνου σφαλμάτων είναι η πρώτη αρχή. Ωστόσο, βάσει αυτής της αιτιολογικής σκέψης, οι επιστήμονες δεδομένων υποχρεούνται όχι μόνο να δημιουργήσουν ακριβή μοντέλα αλλά και μοντέλα που δεν κάνουν διακρίσεις! Όπως περιγράφεται παραπάνω, αυτό μπορεί να μην είναι δυνατό σε όλες τις περιπτώσεις. Το κλειδί παραμένει να είναι ευαίσθητο στις διακριτικές επιπτώσεις που μπορεί να προκύψουν από το ερώτημα που αντιμετωπίζει και τον τομέα του, χρησιμοποιώντας επιχειρηματικούς και τεχνικούς πόρους για τον εντοπισμό και τον μετριασμό της ανεπιθύμητης προκατάληψης στα μοντέλα AI.

2. Το δικαίωμα εξήγησης

Δικαιώματα για «σημαντικές πληροφορίες σχετικά με τη λογική που εμπλέκονται» στην αυτοματοποιημένη λήψη αποφάσεων μπορείτε να βρείτε σε όλα τα άρθρα 13-15 του GDPR. . Η αιτιολογική σκέψη 71 ζητά ρητά «το σωστό [. . .] για να αποκτήσετε ένα εξήγηση '(Δική μου έμφαση) των αυτοματοποιημένων αποφάσεων. (Ωστόσο, η συζήτηση συνεχίζεται ως προς την έκταση τυχόν δεσμευτικών δικαίωμα εξήγησης .)

Όπως έχουμε συζητήσει, υπάρχουν ορισμένα εργαλεία για την παροχή επεξηγήσεων για τη συμπεριφορά του μοντέλου, αλλά πολύπλοκα μοντέλα (όπως αυτά που αφορούν την όραση του υπολογιστή ή το NLP) δεν μπορούν να γίνουν εύκολα επεξηγήσιμα χωρίς να χάσουν την ακρίβεια. Η συζήτηση συνεχίζεται ως προς το πώς θα μοιάζει μια εξήγηση. Ως ελάχιστη βέλτιστη πρακτική, για μοντέλα που ενδέχεται να χρησιμοποιούνται έως το 2020, το LIME ή άλλες μέθοδοι ερμηνείας θα πρέπει να αναπτυχθούν και να δοκιμαστούν για παραγωγή.

Ηθική και τεχνητή νοημοσύνη: Μια άξια και απαραίτητη πρόκληση

Σε αυτήν την ανάρτηση, εξετάσαμε τα προβλήματα ανεπιθύμητης προκατάληψης στα μοντέλα μας, συζητήσαμε ορισμένα ιστορικά παραδείγματα, παρέχουμε ορισμένες οδηγίες για επιχειρήσεις και εργαλεία για τεχνολόγους και συζητήσαμε βασικούς κανονισμούς που σχετίζονται με την ανεπιθύμητη προκατάληψη.

Καθώς η νοημοσύνη των μοντέλων μηχανικής μάθησης ξεπερνά την ανθρώπινη νοημοσύνη, ξεπερνούν επίσης την ανθρώπινη κατανόηση. Όμως, εφόσον τα μοντέλα σχεδιάζονται από ανθρώπους και εκπαιδεύονται σε δεδομένα που συλλέγονται από ανθρώπους, θα κληρονομήσουν ανθρώπινες προκαταλήψεις.

Η διαχείριση αυτών των ανθρώπινων προκαταλήψεων απαιτεί προσεκτική προσοχή στα δεδομένα, χρησιμοποιώντας AI για να εντοπίσετε και να καταπολεμήσετε ανεπιθύμητες προκαταλήψεις όταν είναι απαραίτητο, να δημιουργήσετε αρκετά διαφορετικές ομάδες και να έχετε μια κοινή αίσθηση ενσυναίσθησης για τους χρήστες και τους στόχους ενός δεδομένου προβλήματος. Η διασφάλιση της δίκαιης τεχνητής νοημοσύνης είναι θεμελιώδης πρόκληση του αυτοματισμού. Ως άνθρωποι και μηχανικοί πίσω από αυτόν τον αυτοματισμό, είναι ηθική και νομική μας υποχρέωση να διασφαλίσουμε ότι η AI λειτουργεί ως δύναμη δικαιοσύνης.

Περαιτέρω ανάγνωση σχετικά με την ηθική και την προκατάληψη της τεχνητής νοημοσύνης στη μηχανική μάθηση

Βιβλία για την προκατάληψη AI

  • Κατασκευασμένο από ανθρώπους: Η συνθήκη AI
  • Αυτοματοποίηση ανισότητας: Πώς προφίλ εργαλείων υψηλής τεχνολογίας, αστυνομία και τιμωρία των φτωχών
  • Ψηφιακό αδιέξοδο: Καταπολέμηση της κοινωνικής δικαιοσύνης στην εποχή της πληροφορίας

Πόροι μηχανικής εκμάθησης

  • Ερμηνεύσιμη μηχανική εκμάθηση: Ένας οδηγός για την εξήγηση μοντέλων Black Box
  • IBM's Επίδειξη AI Fairness 360

Οργανισμοί μεροληψίας AI

  • Αλγοριθμική ένωση δικαιοσύνης
  • Ινστιτούτο AINow και το χαρτί τους Διακριτικά Συστήματα - Φύλο, Φυλή και Ισχύς στο AI

Έγγραφα Συνεδρίου Debiasing και άρθρα περιοδικού

  • Ο άντρας είναι προγραμματιστής υπολογιστών όπως η γυναίκα στο νοικοκυριό; Ενσωματώσεις ενσωματώσεων Word
  • AI Fairness 360: Μια επεκτάσιμη εργαλειοθήκη για τον εντοπισμό, την κατανόηση και τον μετριασμό της ανεπιθύμητης αλγοριθμικής προκατάληψης
  • Μηχανική προκατάληψη (Μεγάλο άρθρο περιοδικού)

Ορισμοί των μετρήσεων προκατάληψης AI

Διαφορετικές επιπτώσεις

Ο διαφορετικός αντίκτυπος ορίζεται ως «η αναλογία πιθανότητας ευνοϊκών αποτελεσμάτων μεταξύ των μη προνομιακών και των προνομιακών ομάδων». Για παράδειγμα, εάν οι γυναίκες έχουν 70% περισσότερες πιθανότητες να λάβουν μια τέλεια βαθμολογία πιστοληπτικής ικανότητας με τους άνδρες, αυτό αντιπροσωπεύει ένα διαφορετικό αντίκτυπο. Μπορεί να υπάρχει διαφορετικός αντίκτυπος τόσο στα δεδομένα εκπαίδευσης όσο και στις προβλέψεις του μοντέλου: σε αυτές τις περιπτώσεις, είναι σημαντικό να κοιτάξετε βαθύτερα τα υποκείμενα δεδομένα εκπαίδευσης και να αποφασίσετε εάν ο διαφορετικός αντίκτυπος είναι αποδεκτός ή πρέπει να μετριαστεί.

Ίση Ευκαιρία Διαφορά

Η διαφορά ίσων ευκαιριών ορίζεται (στο άρθρο AI Fairness 360 που βρέθηκε παραπάνω) ως «η διαφορά στα πραγματικά θετικά ποσοστά [ανάκληση] μεταξύ μη προνομιακών και προνομιακών ομάδων». Το περίφημο παράδειγμα που συζητήθηκε στο άρθρο της διαφοράς ίσων ευκαιριών είναι η υπόθεση COMPAS. Όπως συζητήθηκε παραπάνω, οι Αφροαμερικανοί εκτιμήθηκαν λανθασμένα ως υψηλού κινδύνου σε υψηλότερο ποσοστό από τους Καυκάσιους παραβάτες. Αυτή η απόκλιση αποτελεί διαφορά ίσων ευκαιριών.


Ιδιαίτερες ευχαριστίες στον Jonas Schuett για την παροχή ορισμένων χρήσιμων δεικτών σχετικά με την ενότητα GDPR.

Σχετίζεται με: Stars Realigned: Βελτίωση του συστήματος αξιολόγησης IMDb

Κατανόηση των βασικών

Τι κάνει ένας ηθικός τεχνητής νοημοσύνης;

Οι ηθικοί της τεχνητής νοημοσύνης συνεργάζονται με ερευνητές της τεχνητής νοημοσύνης και ομάδες επιστημών δεδομένων για τη διασφάλιση της ασφάλειας των αλγορίθμων. Ο συγκεκριμένος ρόλος ενός ηθικού τεχνητής νοημοσύνης εξαρτάται από το πλαίσιο. Μερικοί ηθικοί του AI εντοπίζουν αλγοριθμική μεροληψία ή ανήθικη συμπεριφορά και εργάζονται για να το μετριάσουν. Οι ερευνητές ηθικοί συχνά επικεντρώνονται στους μακροπρόθεσμους υπαρξιακούς κινδύνους που θέτει η AI.

Μπορούν οι μηχανές να είναι ηθικές;

Η ηθική κατάσταση των μηχανών συζητείται σε μεγάλο βαθμό στη φιλοσοφία και την επιστήμη των υπολογιστών. Σε γενικές γραμμές, η ηθική ενός συστήματος AI αντικατοπτρίζει τα δεδομένα και το σχεδιασμό του. Τα συστήματα τεχνητής νοημοσύνης που χρησιμοποιούνται σήμερα έχουν συχνά διακριτικά αποτελέσματα ή συλλογισμούς, τα οποία μπορούν να μετριαστούν. Τα προκύπτοντα μετριασμένα συστήματα θεωρούνται συνήθως πιο δίκαια.

Είναι η τεχνητή νοημοσύνη ηθική;

Το αν το AI είναι ηθικό συζητείται σε μεγάλο βαθμό στη φιλοσοφία και στην επιστήμη των υπολογιστών. Είναι ασφαλές να πούμε ότι η ηθική ενός συστήματος AI αντικατοπτρίζει τα δεδομένα και το σχεδιασμό του. Τα συστήματα τεχνητής νοημοσύνης που χρησιμοποιούνται σήμερα έχουν συχνά διακριτικά αποτελέσματα ή συλλογισμό. Τα συστήματα στα οποία ο σχεδιασμός μετριάζει αυτά τα εφέ θεωρούνται συνήθως ασφαλέστερα.

Τι είναι η υψηλή μεροληψία στη μηχανική μάθηση;

Η ανεπιθύμητη προκατάληψη στο AI μπορεί να μετρηθεί με διαφορετικούς τρόπους ανάλογα με το περιβάλλον. Η υψηλή μεροληψία μερικές φορές μετράται ως διαφορετική βαθμολογία πρόσκρουσης μικρότερη από 0,8 ή υψηλότερη από 1,2.

Πώς αντιμετωπίζει η μηχανική μάθηση μεροληψία;

Υπάρχουν εξελιγμένες μέθοδοι για τη μείωση της ανεπιθύμητης προκατάληψης στη μηχανική μάθηση. Οι προηγμένες μέθοδοι, όπως οι διαφορετικοί αφαιρέσεις κρούσης ή η εχθρική αφαίρεση, εφαρμόζονται στο κιτ εργαλείων AIF360.

Brutalist Web Design, Minimalist Web Design και το μέλλον του Web UX

Σχεδιασμός Διεπαφής Χρήστη

Brutalist Web Design, Minimalist Web Design και το μέλλον του Web UX
Τρισδιάστατα γραφικά: Ένας οδηγός WebGL

Τρισδιάστατα γραφικά: Ένας οδηγός WebGL

Τεχνολογία

Δημοφιλείς Αναρτήσεις
Πώς να επιλέξετε το καλύτερο πλαίσιο Front-End
Πώς να επιλέξετε το καλύτερο πλαίσιο Front-End
Χρειάζεστε έναν ήρωα: Ο υπεύθυνος έργου
Χρειάζεστε έναν ήρωα: Ο υπεύθυνος έργου
Πώς να βελτιώσετε την απόδοση της εφαρμογής ASP.NET στο Web Farm με προσωρινή αποθήκευση
Πώς να βελτιώσετε την απόδοση της εφαρμογής ASP.NET στο Web Farm με προσωρινή αποθήκευση
Οι δοκιμασμένοι και αληθινοί νόμοι του UX (με Infographic)
Οι δοκιμασμένοι και αληθινοί νόμοι του UX (με Infographic)
Ανώτερος συνεργάτης πελάτη, υγειονομική περίθαλψη και βιοεπιστήμες
Ανώτερος συνεργάτης πελάτη, υγειονομική περίθαλψη και βιοεπιστήμες
 
Η άνοδος των αυτοματοποιημένων συναλλαγών: Μηχανές που εμπορεύονται το S&P 500
Η άνοδος των αυτοματοποιημένων συναλλαγών: Μηχανές που εμπορεύονται το S&P 500
10 πιο κοινές ευπάθειες ασφαλείας στον Ιστό
10 πιο κοινές ευπάθειες ασφαλείας στον Ιστό
Σκέψεις για τη συγκέντρωση του ιδιωτικού σας αμοιβαίου κεφαλαίου
Σκέψεις για τη συγκέντρωση του ιδιωτικού σας αμοιβαίου κεφαλαίου
Διευθυντής έργου και διαχείρισης προϊόντων
Διευθυντής έργου και διαχείρισης προϊόντων
Η σημασία της διατήρησης πελατών - μια εμπειρική μελέτη
Η σημασία της διατήρησης πελατών - μια εμπειρική μελέτη
Δημοφιλείς Αναρτήσεις
  • δείγμα εφαρμογής angularjs με mvc
  • αυτοματοποιημένες στρατηγικές συναλλαγών που λειτουργούν
  • διαφορά μεταξύ s και c corporation
  • discord bot σε c++
  • πώς βγάζουν χρήματα οι ιστότοποι γνωριμιών
  • ποια αρχή gestalt της αντιληπτικής οργάνωσης επεξηγείται στο παρακάτω παράδειγμα;
Κατηγορίες
  • Επιστήμη Δεδομένων Και Βάσεις Δεδομένων
  • Κατανεμημένες Ομάδες
  • Ευκίνητο Ταλέντο
  • Κερδοφορία & Αποδοτικότητα
  • © 2022 | Ολα Τα Δικαιώματα Διατηρούνται

    portaldacalheta.pt