Instanzenzug: (Verfahrensverlauf),
Gründe
I. Die Klägerin und Revisionsbeklagte (Klägerin) hat die Steuerberaterprüfung nicht bestanden. Sie hat im schriftlichen und mündlichen Prüfungsteil eine durchschnittliche Punktzahl von 4,18 erzielt und damit die für ein Bestehen der Prüfung erforderliche Durchschnittspunktzahl um 0,03 Punkte verfehlt. Die Klägerin hat sowohl gegen die Bewertung ihrer schriftlichen Leistungen in der Klausur ”Verfahrensrecht und andere Steuerrechtsgebiete” und der Klausur ”Steuern vom Einkommen und Ertrag”, in denen sie die Note 5,0 erhalten hat, als auch gegen die Bewertung ihrer Leistungen in der mündlichen Prüfung Einwände erhoben. Aufgrund dieser Einwände haben die Prüfer der Klägerin für die Verfahrensrechtsklausur einen weiteren Punkt und für die Ertragsteuerklausur dreieinhalb weitere Punkte zugestanden, die Benotung dieser beiden Leistungen —entsprechend der Zuordnung von Punkten und Noten in dem bundeseinheitlichen Bewertungsvorschlag— jedoch nicht geändert.
Das von der Klägerin wegen des Nichtbestehens der Prüfung angerufene Finanzgericht (FG) hat in einem anderen bei ihm anhängigen, ebenfalls die Steuerberaterprüfung 1995 betreffenden Verfahren entschieden, die Prüfer hätten sich angesichts der ungewöhnlich hohen Misserfolgsquote im schriftlichen Teil der Prüfung darüber Rechenschaft geben müssen, ob die Klausuraufgaben nicht zu schwierig gewesen seien und ob unter diesen Umständen nicht eine relative Bestehensgrenze beachtet werden müsse (vgl. die in Entscheidungen der Finanzgerichte —EFG— 1998, 245 veröffentlichte Entscheidung vom V 22/96). Daraufhin hat der Prüfungsausschuss mit Rücksicht auf das Klageverfahren der Klägerin über die Prüfung erneut beraten und den Beschluss gefasst, er bestätige ausdrücklich den bei der Bewertung der Klausuren zugrunde gelegten Bewertungsmaßstab. Die Nichtzulassungsquote sei in Anbetracht der inhaltlichen Anforderungen in den Klausuren, der wohlwollenden Bewertung der schriftlichen Arbeiten durch den Prüfungsausschuss, des Fehlens einer standardisierten Ausbildung der Prüfungskandidaten für den Beruf, der Inhomogenität der Prüfungsbewerber, der milden Zulassungspraxis sowie der übrigen statistischen Ergebnisse der Prüfung nicht Ausdruck einer Überspannung der Prüfungsanforderungen.
Die von der Klägerin erhobene Klage hatte Erfolg. Das FG urteilte, die von der Klägerin zur mündlichen Prüfung erhobenen Einwände seien zwar nicht stichhaltig; sie seien vielmehr unsubstantiiert. Auch die Bewertung der schriftlichen Leistungen der Klägerin beruhe nicht auf der Verletzung allgemein gültiger Bewertungsgrundsätze und halte sich im Rahmen des Beurteilungsspielraums der Prüfer. Jedoch habe die hohe Durchfallquote im Schriftlichen —nämlich 46,3 % im Durchschnitt aller Hamburger Prüfungsausschüsse— den Prüfungsausschuss veranlassen müssen, zu überprüfen, ob das schlechte Ergebnis der schriftlichen Arbeiten nicht durch eine ”relative Bestehensgrenze” hätte korrigiert werden müssen. Hierzu führt das FG unter Bezugnahme auf sein Urteil in EFG 1998, 245 aus, die Beweisaufnahme in jenem Verfahren habe ergeben, dass die verbindlichen Punktevorgaben den Bewertungsspielraum der Prüfer in der Prüfungspraxis stark einengten. Deshalb sei es eine Verletzung der Verfahrensbestimmungen, wenn sich der Prüfungsausschuss vor der endgültigen Benotung keine Rechenschaft über die Frage gebe, ob eine hohe Durchfallquote nicht möglicherweise durch eine relative Bestehensgrenze zu korrigieren sei. Eine solche Durchfallquote sei ein Indiz für einen zu hohen Schwierigkeitsgrad der Aufgabenstellung. Das Gericht gehe davon aus, dass die Erkenntnisse, die es in jener einen anderen Prüfungsausschuss betreffenden Beweisaufnahme gewonnen habe, auch für den im Falle der Klägerin tätig gewordenen Prüfungsausschuss zuträfen. Zwar habe sich dieser Prüfungsausschuss in dem schon erwähnten Beschluss mit der Frage befasst, ob das schlechte Ergebnis der schriftlichen Prüfung 1995 Ausdruck einer Überspannung der Prüfungsanforderungen sein könne. Das Protokoll über die betreffende Sitzung des Prüfungsausschusses enthalte aber nur formelhafte Wendungen, die eine Auseinandersetzung mit der Problematik der konkreten Prüfung nicht erkennen ließen. Der Prüfungsausschuss des Landes Schleswig-Holstein habe sich veranlasst gesehen, den Bewertungsrahmen der Verfahrensrechtsklausur abzumildern; dies sei ein Indiz dafür, dass die Prüfer die Klausur als zu schwer bewertet haben. Das Gericht vermisse erkennbare Erwägungen des im Falle der Klägerin berufenen Prüfungsausschusses zum Schwierigkeitsgrad dieser Klausur. Trotz der Bemühungen der Klausurverfasser um einen gleichmäßigen Schwierigkeitsgrad müssten die Klausuren nach Umfang und rechtlichem Schwierigkeitsgrad von Jahr zu Jahr unterschiedlich ausfallen. Bei der Zuordnung der immer gleichen Zahl von 100 Punkten zu den einzelnen Abschnitten der Musterlösung müsse dies zu Ungereimtheiten führen. Der 100-Punkte-Rahmen müsse je nach Umfang der Arbeit und rechtlichem Schwierigkeitsgrad gedehnt oder verengt werden, damit er auf die Klausur ”passe”. Das wiederum könne zur Folge haben, dass dieselbe Klausurleistung von Jahr zu Jahr verschieden bepunktet werde.
Das FG hat den Prüfungsbescheid ”mit der Maßgabe aufgehoben, dass der Prüfungsausschuss…bei Benotung der Klausuren der Klägerin —in Abstimmung mit den anderen Prüfungsausschüssen— überprüft, ob der angewandte Bewertungsvorschlag in Anbetracht der hohen Nichtzulassungsquote zur mündlichen Prüfung unter Beachtung einer relativen Bestehensgrenze zu korrigieren ist”.
Gegen dieses Urteil richtet sich die vom FG zugelassene Revision des Beklagten und Revisionsklägers (Finanzbehörde).
Die Finanzbehörde beantragt, den Gerichtsbescheid des FG aufzuheben und die Klage abzuweisen.
Die Klägerin beantragt, die Revision der Finanzbehörde zurückzuweisen.
II. Die Revision der Finanzbehörde ist begründet; sie führt zur Aufhebung des angefochtenen Urteils und zur Abweisung der Klage (§ 126 Abs. 3 Nr. 1 der Finanzgerichtsordnung —FGO—). Das Urteil des FG verletzt Bundesrecht (§ 118 Abs. 1 Satz 1 FGO).
1. Das Urteil des FG verletzt § 101 FGO. Nach dieser Vorschrift darf das FG die Verpflichtung der Behörde, den Kläger unter Beachtung seiner Rechtsauffassung erneut zu bescheiden, nur dann aussprechen, wenn die Ablehnung oder Unterlassung eines Verwaltungsaktes rechtswidrig und der Kläger dadurch in seinen Rechten verletzt ist. Das FG hat mit seinem Urteil eine Verpflichtung der vorgenannten Art ausgesprochen. Zwar lautet der Entscheidungsausspruch seines Urteils wortwörtlich dahin, der Bescheid der Finanzbehörde werde aufgehoben. Die dem hinzugefügte ”Maßgabe” verwandelt diese schlichte Aufhebung des von der Finanzbehörde erlassenen Verwaltungsaktes jedoch bei sinngemäßer Handhabung in einen Verpflichtungsausspruch, den die Klägerin auch begehrt hatte (anders bei einer Anfechtungsklage, dazu Beschluss des Senats vom VII B 197/99, zur Veröffentlichung in BFH/NV bestimmt). Mit der vom FG in den Urteilsausspruch aufgenommenen Maßgabe wird von der Finanzbehörde verlangt, dass sie die Benotung der Klausuren der Klägerin überprüft (bzw. durch den zuständigen Prüfungsausschuss überprüfen lässt). Das schließt sinngemäß die Verpflichtung der Finanzbehörde ein, aufgrund des Ergebnisses dieser Überprüfung entweder in einer erneuten Entscheidung die Prüfung für bestanden oder erneut für nicht bestanden zu erklären. Nur dann kann sich die vom FG verlangte Überprüfung auf die Rechtsstellung der Klägerin auswirken und damit überhaupt geeignet sein, den Rechtsschutzanspruch der Klägerin zu befriedigen.
Ein solcher Verpflichtungsausspruch (in der Form des Bescheidungsausspruchs) darf nach § 101 Satz 1 FGO nur ergehen, wenn feststeht, dass die Ablehnung oder Unterlassung des vom Kläger begehrten Verwaltungsaktes (hier: des Ausspruchs, die Prüfung sei bestanden) rechtswidrig ist. Daran fehlt es. Das FG hat keine Tatsachen festgestellt, die bei richtiger Rechtsanwendung den Schluss rechtfertigen könnten, die angegriffene Prüfungsentscheidung der Finanzbehörde sei rechtswidrig. Das FG hat diesen Schluss selbst nicht gezogen. Es hält es vielmehr nur für möglich, dass der Prüfungsausschuss aufgrund einer Überprüfung der Prüfungsanforderungen seine bisherige Entscheidung, die Klägerin habe die Prüfung nicht bestanden, als rechtswidrig erkennt und die von der Klägerin erbrachten Prüfungsleistungen nunmehr so bewertet, dass die Klägerin die Prüfung gemäß § 28 Abs. 1 Satz 2 der Verordnung zur Durchführung der Vorschriften über Steuerberater, Steuerbevollmächtigte und Steuerberatungsgesellschaften (DVStB) bestanden hat.
Wenn das FG ein solches Überdenken der Prüfungsentscheidung seitens des Prüfungsausschusses für notwendig hielt, hätte es diesem hierzu und zur (erneuten) Ausübung des allein ihm zustehenden Bewertungsvorrechtes durch Aussetzung des Klageverfahrens nach § 74 FGO Gelegenheit geben müssen (siehe dazu im Einzelnen Entscheidungen des Senats vom VII B 68/93, BFHE 172, 273, BStBl II 1994, 50, und vom VII R 66/97, BFHE 184, 157, BStBl II 1998, 218). Das FG durfte hingegen nicht die Prüfungsentscheidung aufheben, ohne festgestellt zu haben, dass sie rechtswidrig ist.
Sofern das FG von der Überlegung ausgegangen sein sollte, die von der Finanzbehörde in dem angefochtenen Bescheid sinngemäß ausgesprochene Ablehnung einer Entscheidung dahin, dass die Klägerin die Steuerberaterprüfung bestanden habe, sei deshalb aufzuheben, weil der Prüfungsausschuss trotz Stellungnahme zu der Bewertung der Prüfungsleistungen der Klägerin deren Anspruch auf ein Überdenken dieser Bewertung nicht Genüge getan habe, vermöchte auch dies das Urteil nicht zu tragen.
Es bedarf keiner abschließenden Erörterung, unter welchen Voraussetzungen der verfahrensrechtliche Anspruch des Prüflings auf Rechtsschutz durch eine verwaltungsinterne Kontrolle im Wege des Überdenkens seiner gegen die Prüfungsentscheidung erhobenen Einwendungen (zur Selbständigkeit dieses Anspruchs vgl. 6 B 63.98, nicht veröffentlicht) in einen Anspruch auf Aufhebung der Prüfungsentscheidung und auf erneute Bescheidung gleichsam umschlagen kann. Auch dann, wenn das FG die Rechtswidrigkeit der Prüfungsentscheidung nicht feststellen kann, mag es unter Umständen in Betracht kommen, die Prüfungsbehörde durch Urteil zur erneuten Entscheidung über das Bestehen einer Prüfung zu verpflichten (oder ihre Entscheidung über das Nichtbestehen einer Prüfung durch Kassationsurteil aufzuheben), um zu erreichen, dass substantiierte Einwendungen des Prüflings von den Prüfern, denen ein prüfungsspezifischer Bewertungsspielraum eröffnet ist, geprüft werden. Voraussetzung für eine solche Entscheidung ist jedoch, dass sich entweder die Prüfungsbehörde weigert, ein erforderliches verwaltungsinternes Überdenkungsverfahren überhaupt durchzuführen, oder ein solches Verfahren zwar durchgeführt hat, dabei jedoch den rechtlichen Anforderungen an ein solches Verfahren nicht gerecht geworden ist und nicht damit zu rechnen ist, dass die Mängel des Verfahrens noch —ggf. nach einem entsprechenden gerichtlichen Hinweis— beseitigt werden. Hier hat sich die Finanzbehörde indes nicht geweigert, ein Überdenkungsverfahren durchzuführen. Es kann auch keine Rede davon sein, dass in den beiden tatsächlich durchgeführten Überdenkungsverfahren die gegen die Prüfungsentscheidung vorgebrachten Einwände nicht ausreichend überdacht worden wären.
Dazu ist im Einzelnen folgendes zu bemerken:
Die von der Klägerin selbst erhobenen Einwände gegen die Bewertung ihrer Leistungen in der Steuerberaterprüfung hat der zuständige Prüfungsausschuss überdacht. Das FG hat keinerlei Tatsachen festgestellt, die darauf schließen lassen, dass das Überdenkungsverfahren insoweit nicht ordnungsgemäß durchgeführt worden wäre. Auch das FG hat dies nicht angenommen.
Das FG beanstandet hingegen, dass der Prüfungsausschuss beim Überdenken der Benotung der Leistungen der Klägerin nicht bzw. nicht ausreichend überprüft habe, ob aufgrund der überdurchschnittlich hohen Misserfolgsquote im schriftlichen Teil der Steuerberaterprüfung 1995 die Bewertungsmaßstäbe zu korrigieren seien. Das FG hält es also offenbar für möglich, dass die Prüfungsanforderungen überspannt gewesen sind.
Dass die Klägerin selbst diesbezügliche (substantiierte) Einwendungen erhoben hätte, ist freilich dem Urteil des FG nicht zu entnehmen. Das mag jedoch auf sich beruhen, weil möglicherweise Anlass für ein verwaltungsinternes Überdenkungsverfahren nicht nur von dem Prüfling erhobene substantiierte Einwendungen geben mögen, wie es die Rechtsprechung des erkennenden Senats und des BVerwG bisher angenommen hat (vgl. z.B. Senatsbeschluss vom VII B 175/94, BFH/NV 1996, 180, und 6 C 4.93, Buchholz, Sammel- und Nachschlagewerk der Rechtsprechung des Bundesverwaltungsgerichts, 421.0 Prüfungswesen Nr. 334), sondern, wie das FG stillschweigend unterstellt, auch solche Einwendungen, die das wegen der rechtlichen Überprüfung der Verwaltungsentscheidung unter Wahrung des prüfungsspezifischen Bewertungsspielraums der Prüfer angerufene FG erhebt.
Die Finanzbehörde bzw. der Prüfungsausschuss haben sich jedoch der vom FG für notwendig gehaltenen Überprüfung der angegriffenen Prüfungsentscheidung unter dem Gesichtspunkt einer Überspannung der Prüfungsanforderungen nicht verschlossen. Sie haben sie vielmehr ungeachtet dessen durchgeführt, dass sie zum Überdenken der Prüfungsanforderungen vom Gericht nicht ausdrücklich aufgefordert worden sind und das Verfahren vom FG auch nicht gemäß § 74 FGO zu diesem Zwecke ausgesetzt worden ist. Der Prüfungsausschuss hat von sich aus seine Entscheidung überprüft, nachdem ihm durch das Urteil des FG in dem Verfahren eines anderen Teilnehmers derselben Prüfung die grundsätzlichen Bedenken des FG wegen der Bewertung der Prüfungsleistungen bekannt geworden waren.
Das FG hatte zu überprüfen, ob die insoweit vom Prüfungsausschuss durchgeführte verwaltungsinterne Kontrolle der Prüfungsentscheidung unter dem Gesichtspunkt einer möglichen Überspannung der Prüfungsanforderungen den verfassungsrechtlichen Anforderungen gerecht geworden ist (vgl. BVerwG-Urteil in Buchholz, a.a.O., Nr. 334). Eine solche Prüfung kann im Allgemeinen nicht lediglich vordergründig auf der Grundlage des Protokolls der betreffenden Sitzung des Prüfungsausschusses erfolgen (a.A. offenbar , EFG 1996, 507). Nur darauf abzustellen, statt z.B. die Mitglieder des Prüfungsausschusses ggf. zu den von ihnen angestellten Erwägungen anzuhören, verbietet sich, weil keine Gewähr besteht, dass das Sitzungsprotokoll bzw. ein hier in diesem festgehaltener ”Beschluss” des Prüfungsausschusses die von den Mitgliedern des Ausschusses angestellten Erwägungen vollständig wiedergibt. Eine Rechtsgrundlage für die vom FG insofern offenbar unterstellte Protokollierungspflicht ist nicht erkennbar.
Im Übrigen gehört die Beurteilung des Schwierigkeitsgrades einer Klausur, die Unterscheidung zwischen schwierigen und weniger schwierigen Teilen der Aufgabenstellung und die entsprechende Benotung der hierzu im Einzelnen und in der Klausur als Ganzer erbrachten Leistungen des Prüflings zum Bewertungsvorgang. Für diesen wird den Prüfern von der Rechtsprechung ein Beurteilungsspielraum eingeräumt, weil die in diesem Zusammenhang vorzunehmenden komplexen prüfungsspezifischen Bewertungen im Gesamtzusammenhang des Prüfungsverfahrens getroffen werden müssen und sich nicht ohne weiteres in nachfolgenden gerichtlichen Streitverfahren einzelner Prüflinge isoliert nachvollziehen lassen (vgl. u.a. und 213/83, BVerfGE 84, 34, 50 ff.; 6 C 12.92, Buchholz 421.0 Prüfungswesen Nr. 320, und vom 6 C 5.93, a.a.O., Nr. 329; Beschluss des erkennenden Senats vom VII S 14/98, BFH/NV 1999, 1133, mit Nachw.). Es liegt auf der Hand, dass dies der vom FG erwarteten (schriftlichen) Dokumentation der von den Prüfern angestellten Erwägungen und der gerichtlichen Überprüfung der ”Ernsthaftigkeit” ihrer ”Auseinandersetzung” mit dem Einwand überhöhter Prüfungsanforderungen von vornherein Grenzen setzt. Es gibt insbesondere keinen (verfahrensrechtlichen) Anspruch des Prüflings dahin, dass die Prüfer ihre prüfungsspezifischen Erwägungen erschöpfend oder jedenfalls nachvollziehbar darlegen.
Aber auch ungeachtet dessen ist die Ansicht des FG, der Prüfungsausschuss habe die von diesem in dem vorgenannten Parallelverfahren erhobenen Bedenken gegen die Bewertung der schriftlichen Leistungen in der Steuerberaterprüfung 1995 nicht ausreichend überdacht, nicht zu billigen. Der Prüfungsausschuss muss Einwendungen gegen seine Entscheidung nur in dem Umfang überdenken, in dem sie —vom Prüfling, möglicherweise auch vom FG— nachvollziehbar und substantiiert geltend gemacht worden sind. Hier erschöpfte sich der Einwand gegen die Bewertungsmaßstäbe des Prüfungsausschusses darin, dass die Misserfolgsquote im schriftlichen Teil der Steuerberaterprüfung 1995 außergewöhnlich hoch gewesen sei. Der erkennende Senat hat jedoch wiederholt entschieden, dass diese Beobachtung für sich genommen keinen Anlass geben kann, die Bewertungsmaßstäbe zu verändern, da eine hohe Misserfolgsquote zwar unter Umständen ihren Grund in einer Überspannung der Prüfungserwartungen haben kann, für sie jedoch ebenso eine Fülle anderer Ursachen allein oder zumindest mitverantwortlich sein kann (, BFHE 127, 290, BStBl II 1979, 417, und vom VII R 34/98, BFHE 188, 502, BStBl II 1999, 573). Die Feststellung, dass in einer bestimmten Prüfung eine hohe Misserfolgsquote aufgetreten ist, ist deshalb für sich gesehen ungeeignet, Grundlage einer sachlich angemessenen Überprüfung des Schwierigkeitsgrades einer Aufgabe und der Angemessenheit der Bewertungsmaßstäbe zu sein. Anders als das FG offenbar meint, gab deshalb die vom FG ermittelte hohe Misserfolgsquote im schriftlichen Teil der Steuerberaterprüfung 1995 in Hamburg dem Prüfungsausschuss keinen Anlass, ins Blaue hinein die einzelnen in der Steuerberaterprüfung gestellten Aufgaben auf ihren Schwierigkeitsgrad hin zu untersuchen, die Maßstäbe, welche bei der Bewertung der von den Prüflingen zu den einzelnen Aufgaben erbrachten Leistungen angelegt worden sind, erneut zu überdenken und darüber hinaus dem FG über all dies gleichsam ungefragt schriftlich Rechenschaft zu geben. Es ist vielmehr grundsätzlich Sache des Prüflings, anzugeben, welche Fragestellung er für unangemessen schwer hält oder welche Bewertungsentscheidung seiner Meinung nach auf einer Überspannung der Prüfungsanforderungen beruht. Wird dazu nichts vorgetragen, sondern nur pauschal eine hohe Misserfolgsquote bei der betreffenden Aufgabe gerügt, so kann der Prüfling im Überdenkungsverfahren allenfalls eine ebenso pauschale Stellungnahme des Prüfungsausschusses erwarten.
Eine Verpflichtung mehrerer Prüfungsausschüsse eines Landes, ihre Bewertungsmaßstäbe vor Abschluss des Überdenkungsverfahrens untereinander ”abzustimmen” oder sogar zu vereinheitlichen, besteht dabei, anders als das FG offenbar meint, nicht; kein Prüfer ist von Rechts wegen gehalten, sich an den Anforderungen bestimmter anderer Prüfer oder einem statistisch ermittelten ”Durchschnitt” statt an seinem fachlich fundierten Urteil über die Anforderungen des Berufes des Steuerberaters zu orientieren (vgl. BVerwG-Entscheidungen vom 7 B 198.87, Buchholz, a.a.O., 421.0 Prüfungswesen Nr. 245; in Buchholz, a.a.O., 421.0 Prüfungswesen Nr. 320, und vom 6 B 73.94, Buchholz, a.a.O., 421.0 Prüfungswesen Nr. 338 sowie das Senatsurteil in BFHE 188, 502, BStBl II 1999, 573).
2. Die Sache ist spruchreif. Die Klage ist abzuweisen. Das FG, an dessen Feststellungen der erkennende Senat nach § 118 Abs. 2 FGO gebunden ist, hat keine Tatsachen festgestellt, aufgrund deren die angegriffene Prüfungsentscheidung wegen eines Verstoßes gegen allgemein gültige Bewertungsgrundsätze oder einer Überschreitung des dem Prüfungsausschuss zustehenden Beurteilungsspielraums rechtlich zu beanstanden wäre.
a) Das FG hat die von der Klägerin gegen die mündliche Prüfung erhobenen Einwände ohne Rechtsverstoß als unsubstantiiert zurückgewiesen. Wegen der gegen die schriftliche Prüfung erhobenen Einwände der Klägerin hat das FG zutreffend auf das Ergebnis des verwaltungsinternen Überprüfungsverfahrens Bezug genommen, durch das dem Rechtsschutzanspruch der Klägerin Genüge getan worden ist, da die Klägerin lediglich eine unzutreffende prüfungsspezifische Bewertung ihrer Leistungen gerügt hat.
b) Die hohe Misserfolgsquote, die in Hamburg im schriftlichen Teil der Steuerberaterprüfung 1995 erzielt worden ist, gibt —wie auch das FG im Ergebnis zu Recht angenommen hat— keinen Anlass, die angegriffene Prüfungsentscheidung als rechtswidrig zu beanstanden. Wie der erkennende Senat seit seinen Urteilen vom VII 18/62 (Höchstrichterliche Finanzrechtsprechung —HFR— 1963, 375), vom VII 35/63 (HFR 1964, 467) und in BFHE 127, 290, BStBl II 1979, 417 wiederholt, zuletzt in seinem Urteil in BFHE 188, 502, BStBl II 1999, 573, entschieden hat, ist zwar das Urteil der Prüfer über den Schwierigkeitsgrad der Prüfungsaufgaben einer —wenn auch eingeschränkten— gerichtlichen Überprüfung zugänglich. Ziel der Aufgabenstellung und der Bewertung der bei ihrer Lösung erbrachten Leistungen darf in der Steuerberaterprüfung einzig und allein sein, festzustellen, ob der Prüfling den an einen durchschnittlich qualifizierten angehenden Steuerberater zu stellenden Anforderungen an sein Wissen auf den in § 37 a Abs. 3 des Steuerberatungsgesetzes (StBerG) aufgeführten Prüfungsgebieten und an seine Fähigkeit, dieses Wissen anzuwenden, genügt.
Es besteht dabei ein enges Wechselverhältnis zwischen der Schwierigkeit der Prüfungsaufgabe und der Bewertung der Leistungen der Prüflinge: Auch eine sehr schwierige Aufgabe zu stellen, kann zulässig sein und ihre Bearbeitung durch den Prüfling kann Aufschluss über dessen für die Berufsausübung erforderliches Wissen und Können geben. Allerdings wird bei einer solchen, besonders schwierigen Aufgabe oftmals für das Bestehen der Prüfung oder sogar eine gute Bewertung nicht gleichsam eine ”perfekte” Bearbeitung erwartet werden können; dafür wird vielmehr bereits eine noch unvollständige oder sonst vom Grad der Perfektion weit entfernte Lösung, eine Lösung, die lediglich das Problem erkennt, wenn nicht sogar schon ein brauchbarer Lösungsansatz des Prüflings als ausreichend erachtet werden müssen. Hingegen werden bei einer ”leichten” Aufgabenstellung unter Umständen bereits geringfügige Fehler, Auslassungen oder argumentative Verkürzungen in einer erheblichen Verminderung der Bewertung zu Buche schlagen müssen. Dieses Verhältnis zwischen der Schwierigkeit einer Aufgabenstellung und den Maßstäben, die bei der Bewertung der Leistungen des Prüflings anzulegen sind, angemessen auszutarieren, erfordert komplexe prüfungsspezifische Bewertungen, die vorzunehmen den Prüfern vorbehalten ist. Diesen steht dabei ein entsprechender Bewertungsspielraum zu. Gerichte können nur darüber befinden, ob die äußersten Grenzen dieses Bewertungsspielraums überschritten worden sind (vgl. statt aller Beschluss des erkennenden Senats vom VII B 343/98, BFH/NV 1999, 1517). Das im Übrigen verbleibende Kontrolldefizit wird durch den Anspruch des Prüflings auf ein verwaltungsinternes Überdenkungsverfahren in dem möglichen und deshalb den verfassungsrechtlichen Anforderungen genügenden Umfange kompensiert (vgl. zuletzt Urteil des erkennenden Senats vom VII R 111/98, BFHE 189, 280, BStBl II 1999, 803). Das Gericht darf das Urteil der Prüfer über den angemessenen Schwierigkeitsgrad einer Aufgabe bzw. die angemessene Strenge der Maßstäbe bei der Bewertung ihrer Lösung nur dann verwerfen, wenn dieses schlechterdings unverständlich erscheint, weil es die durchschnittlichen Anforderungen an einen angehenden Steuerberater erkennbar überspannt. Dabei hat der Prüfer einerseits die Bedeutung der durch das Grundgesetz geschützten Berufsfreiheit zu berücksichtigen, sowie —in tatsächlicher Hinsicht— die fehlende oder zumindest relativ geringe berufliche Erfahrung des Prüflings, der die für die Ausübung des Berufes eines Steuerberaters erforderliche Qualifikation erst durch seine praktische Tätigkeit vervollkommnen wird; andererseits darf der Prüfer den hohen Rang des Interesses der Allgemeinheit an einem umfassenden und wirksamen Schutz vor ungeeigneten Berufsangehörigen in Rechnung stellen.
Um festzustellen, ob dem bei der Bewertung einer Prüfungsleistung entsprochen worden ist, ist die Höhe der Misserfolgsquote bei den Prüflingen eines bestimmten Landes und in einem bestimmten Prüfungsteil, einer bestimmten Klausur oder einer bestimmten, in einer Klausur gestellten Teilaufgabe ungeeignet. Die Höhe der Quote der Bewerber, welche eine Prüfung nicht bestehen, kann allenfalls als Indiz dafür herangezogen werden, dass die Prüfer ihre Anforderungen nicht ausreichend an Ziel und Zweck der Prüfung ausgerichtet haben (Senatsurteil in BFHE 127, 290, BStBl II 1979, 417). Sie macht aber nähere Feststellungen hierzu nicht entbehrlich. Solche Feststellungen hat das FG nicht getroffen.
c) Weder das StBerG noch das Verfassungsrecht schreibt ein bestimmtes Quorum der Prüfungskandidaten vor, deren Leistungen in der Prüfung als für das Bestehen der Prüfung ausreichend bewertet werden müssen. Eine diesbezügliche Bestehensregel würde das Urteil der Prüfer darüber, ob ein Kandidat die Voraussetzungen erfüllt, um den Anforderungen an den Beruf des Steuerberaters genügen zu können, nicht, wie die Klägerin glauben machen will, ergänzen, sondern unterlaufen. Eine hohe Misserfolgsquote wird daher den Prüfern zwar im Allgemeinen Anlass geben müssen, in besonderem Maße kritisch ihre Bewertungsmaßstäbe zu überdenken, weil sie eine Überspannung der Prüfungsanforderung als möglich erscheinen lässt; es wäre hingegen sachwidrig, die bereits anderweit auf der Grundlage einer Bewertung der Leistungen des Prüflings nach Maßgabe der oben erläuterten Maßstäbe vorgenommene Benotung zu verändern, um eine bestimmte, etwa in Angleichung an frühere Prüfungstermine angestrebte Misserfolgsquote zu erzielen.
d) Auch die —vom FG im Streitfall für wesentlich erachtete— Beobachtung, dass die Prüfungsleistungen in einem bestimmten Prüfungstermin durchschnittlich schlechter benotet worden sind als in früheren Terminen oder dass jedenfalls eine im Vergleich zu diesen Terminen deutlich höhere Misserfolgsquote aufgetreten ist, gestattet kein fundiertes Urteil darüber, dass die Prüfungsanforderungen in dem betreffenden Termin überspannt waren. Wie die vom FG selbst in seinem Urteil angestellten abschließenden Erwägungen erkennen lassen, könnten nämlich allenfalls durch umfangreiche, über den Bereich einer einzelnen Prüfungsbehörde hinausreichende Untersuchungen insbesondere zur Zusammensetzung des betreffenden Prüfungsjahrganges tragfähige Erkenntnisse darüber gewonnen werden, ob für das schlechte Ergebnis die durch eine entsprechend milde Bewertung der Leistung des Prüflings nicht ausgeglichene besondere Schwierigkeit der Aufgabenstellung bzw. bei einer normal schweren Aufgabe nicht angemessene Anforderungen an deren Bearbeitung verantwortlich zu machen sind. Dass derartige Ermittlungen praktisch nicht durchführbar sind, liegt auf der Hand; sie werden jedenfalls weder vom StBerG noch vom Verfassungsrecht für eine rechtmäßige Prüfungsentscheidung verlangt. Insbesondere erfordert der Grundsatz der Chancengleichheit zwar, dass den Prüflingen Gelegenheit gegeben wird, unter möglichst gleichen Bedingungen ihre Eignung für den Zugang zum Beruf des Steuerberaters darzutun. Das FG hat aber nicht festgestellt, dass die Finanzbehörde dem nicht Rechnung getragen hat; es hat vielmehr ausdrücklich hervorgehoben, die Klausurverfasser bemühten sich, einen gleichmäßigen Schwierigkeitsgrad einzuhalten. Dass der Schwierigkeitsgrad tatsächlich stets der Gleiche ist, verlangt der Grundsatz der Chancengleichheit schon deshalb nicht, weil, wie dargelegt, Unterschiede im Schwierigkeitsgrad durch unterschiedliche Anforderungen an die Fallbearbeitung des Prüflings oder seine sonstige Leistung ausgeglichen werden können und im Allgemeinen auch ausgeglichen werden. Dass dieser Ausgleich, dessen Notwendigkeit den Prüfungsbehörden und den Prüfern zweifellos bewusst ist, mit dem Ergebnis erfolgt, dass stets eine in etwa gleiche Misserfolgsquote erzielt wird, verlangt der Grundsatz der Chancengleichheit ebenfalls nicht. Eine Benotungspraxis, die darauf aus ist, eine solche immer gleiche —numerisch notwendigerweise willkürlich festgelegte— Misserfolgsquote zumindest nicht zu überschreiten, wäre vielmehr, wie dargelegt, sachwidrig.
e) Rechtlichen Bedenken begegnet schließlich —anders als das FG offenbar angenommen hat— auch nicht die Praxis der Prüfungsbehörden, in ihren Lösungshinweisen bei der Steuerberaterprüfung unabhängig von dem Schwierigkeitsgrad der jeweiligen Aufgabe stets eine Bewertung mit maximal 100 Punkten vorzusehen. Ungeachtet der ohnehin fehlenden Rechtsverbindlichkeit solcher Lösungshinweise oder Musterlösungen führt dieses Verfahren entgegen der Ansicht des FG bei sachgemäßer Handhabung nicht zu ”Ungereimtheiten”.
Wie der Senat bereits in seinen Urteilen vom VII R 152/97 und in BFHE 188, 502, BStBl II 1999, 573 ausgeführt hat, dienen die Bewertungsvorschläge in erster Linie dazu, dem Prüfer die Gewichtung einzelner Teile der Prüfungsleistung zu erleichtern. Denn eine Klausur in der Steuerberaterprüfung besteht in der Regel aus mehreren einzelnen Sachverhalten oder sonstigen Prüfungsaufgaben, die jede für sich eine Vielzahl einzelner Probleme aufwirft, deren Bearbeitung durch den Prüfling mehr oder weniger gesondert bewertet werden kann. Da jedoch für die Klausur, wie sich aus § 24 Abs. 2 Satz 1 DVStB ergibt, eine Note zu bilden ist, bedarf es einer Bestimmung des Verhältnisses, in dem die bei der Lösung der vorgenannten Einzelaufgaben und -probleme erbrachten Leistungen des Prüflings die Note bestimmen sollen. Die Ermittlung jener Note muss in der Regel gleichsam in einem zweiten Arbeitsgang geschehen, in dem die einzeln bewerteten Teilleistungen zu einer Gesamtnote für die betreffende Klausur zusammengefasst werden. Das Bepunktungssystem ermöglicht es dem Prüfer, der unterschiedlichen Qualität der Bearbeitung von Teilleistungen Rechnung zu tragen und durch einen einfachen Rechenvorgang seinem diesbezüglichen Urteil den gebührenden Einfluss auf die Note für die gesamte Klausur zu verschaffen.
Mit Recht gehen die Lösungshinweise dabei davon aus, dass in jeder Klausur —unabhängig von ihrem Schwierigkeitsgrad— die Note 1 (vgl. § 15 Abs. 1 DVStB) muss erzielt werden können. Sie teilen deshalb die der Note 1 zugeordnete Summe von (maximal) 100 Punkten auf die einzelnen Teilaufgaben entsprechend ihrem Umfang, ihrem ggf. unterschiedlichen Schwierigkeitsgrad und ihrer Bedeutung für die Feststellung einer ausreichenden Qualifikation des Prüflings auf, wobei die Notwendigkeit einer solchen Aufteilung zugleich die Überprüfung erleichtert, ob die Klausur insgesamt, weil sie eine ausreichende Anzahl von Einzelproblemen enthält, den Kandidaten hinreichend Gelegenheit gibt, ihre Kenntnisse und Fähigkeiten unter Beweis zu stellen. Dem besonderen Schwierigkeitsgrad oder Umfang einzelner Teilaufgaben, für die sich einzelne Bewertungsschritte von jeweils einem Punkt nicht sinnvoll definieren lassen, kann dadurch Rechnung getragen werden, dass mehrere Punkte ausgewiesen werden und dass bei einer schweren Aufgabe schon für eine nicht ”perfekte” Lösung alle vorgesehenen Punkte vergeben werden, während bei einer ”leichten” Aufgabe dafür eine gemessen an einer gedachten idealen Bearbeitung vollkommenere Leistung verlangt wird.
Das Bepunktungssystem ist auch nicht deshalb für eine gerechte Bewertung der Leistungen der Prüflinge ungeeignet, weil stets —unabhängig von den Schwierigkeiten der Prüfungsaufgabe— eine bestimmte Punktzahl (40 Punkte) für die Bewertung der Prüfungsleistung als ausreichend erzielt werden muss. Denn dies bedeutet bei sachgerechter Handhabung des Systems nicht, dass der Prüfling ein Ausreichend erzielt hat, wenn er rein quantitativ 40 % der möglichen Teilleistungen erbracht hat. Denn die Punkte für einzelne mögliche Teilleistungen sind sachgerecht so zu vergeben, dass darin die Schwierigkeit einzelner Teilaufgaben ihren Niederschlag findet und die Bepunktung von Teilleistungen strikt nach Maßgabe der Bedeutung erfolgt, welche die Beherrschung dieser Aufgabe für die ordnungsgemäße Ausübung des Berufes eines Steuerberaters hat.
Dass gegen die vorgenannten Bewertungsgrundsätze im Falle der Klägerin verstoßen worden ist, hat das FG ebenso wenig festgestellt wie einen Verstoß gegen sonstige Grundsätze des Prüfungsrechts, so dass die Klage abgewiesen werden muss.
Auf diese Entscheidung wird Bezug genommen in folgenden Gerichtsentscheidungen:
Fundstelle(n):
BFH/NV 2000 S. 755 Nr. 6
DStRE 2000 S. 609 Nr. 11
TAAAA-66105